[Paper] 基于SLO驱动且成本感知的Kubernetes自动伸缩框架
Kubernetes 提供原生的自动伸缩机制,包括 Horizontal Pod Autoscaler、Vertical Pod Autoscaler 和节点级自动伸缩器,以实现弹性……
Kubernetes 提供原生的自动伸缩机制,包括 Horizontal Pod Autoscaler、Vertical Pod Autoscaler 和节点级自动伸缩器,以实现弹性……
大型语言模型(LLM)代理虽然在数字领域表现出色,但由于在形成……方面的挑战,它们在物理世界部署方面存在显著差距。
我们研究规划与验证社区中的两个问题之间的关联:Conformant planning 和 hyperproperties 的 model-checking。Conformant pl...
深度神经网络已经加速了 inverse-kinematics (IK) 推理,使得低成本机械臂能够实时执行复杂轨迹,...
在边缘设备上部署大规模语言模型(LLMs)具有挑战性,因为它们的内存和电力资源有限。仅云推理可以降低设备负担……
多模态大型语言模型(LLMs)通过借助广泛的临床知识来解释扫描图像,为医学影像引入了一种新兴范式……
有声书解读正受到越来越多的关注,因为它们提供了易于获取且深入的书籍分析,为读者提供实用的洞见……
中国的电子商务直播,尤其是在抖音等平台上,已经成为主要的销售渠道,但主播常常使用 morphs 来规避审查和...
Parameter-efficient fine-tuning 已成为将 large language models 适配到 downstream tasks 的主流范式。Low-rank adaptation 方法,如 LoR…
Graph federated learning 使得在保护原始数据隐私的前提下,能够协同从分布式子图中提取高阶信息。How...
大型语言模型(LLMs)在代码生成方面展现了卓越的能力,但在复杂的多步骤编程中仍会出现系统性错误……
我们提出 LLM‑PeerReview,这是一种无监督的 LLM 集成方法,它从每个查询的多个 LLM 生成的候选答案中选择最理想的响应,…