[Paper] RelayLLM:通过协作解码实现高效推理
大型语言模型(LLMs)在复杂推理方面常常受到高计算成本和延迟的阻碍,而资源高效的 Small Language Models (SL...
大型语言模型(LLMs)在复杂推理方面常常受到高计算成本和延迟的阻碍,而资源高效的 Small Language Models (SL...
文档问答(DocQA)专注于基于给定文档回答问题,但现有的 DocQA 代理缺乏有效的工具利用和……
针对作物病害分析的 Visual Question Answering 需要准确的视觉理解和可靠的语言生成。本工作提出了一种轻量级的 vi...
LLM 驱动的 agentic 应用程序正日益自动化复杂的多步骤任务,但由于组件异构,如何高效地为其提供服务仍然是一个挑战。
设计科学仪器通常需要在大型且高度受约束的设计空间中进行探索,并使用计算成本高的物理仿真。这些...
癫痫是一种慢性神经系统疾病,以反复的非诱发性发作为特征,影响全球超过5000万人,并带来显著风险……
癫痫是一种慢性神经系统疾病,以反复的无诱因发作为特征,影响全球超过5000万人,并带来显著的风险……
隐私保护的联邦平均是保护联邦学习中客户端隐私的核心方法。本文中,我们研究了在异步…
提出了一项跨配置基准测试,以在通用开发项目的背景下探索 AVX / NEON 内在函数的能力和局限性。
在摩尔定律的驱动下,晶体管的尺寸已被压缩到纳米尺度。需要先进的量子输运(QT)求解器来准确……
由 AI 编码代理生成的 Pull request(PR)描述是向人工审阅者传达代码更改的主要渠道。然而,alignment b...
本文对 Untappd 进行了一项纵向伦理分析。Untappd 是一款社交饮酒应用,通过徽章(badges)、连胜(streaks)以及社交功能将啤酒消费游戏化。
无许可共识协议需要一种稀缺资源来调节领袖选举并提供 Sybil 抵抗。现有范式如 Proof of Work …
Neural-Symbolic (NeSy) 人工智能已经成为一种有前景的方法,用于将神经网络的学习能力与可解释性相结合。
本工作提出了 DCIM 3.0,一个统一的框架,集成了 semantic reasoning、predictive analytics、autonomous orchestration 和 unified connectivity,用于 ne...
深度学习已经彻底改变了视觉数据分析,卷积神经网络(CNN)在学习有意义的特征表示方面表现出极高的效能……
在现代大规模 Mixture-of-Experts (MoE) 架构中,普遍存在的 “memory wall” 瓶颈被显著放大。MoE 的固有架构稀疏性……
图神经网络(GNNs)是学习图结构数据的强大工具,但其可扩展性受到低效的 mini-batch 生成、数据……的阻碍。
本文介绍了 DDMIN-LOC,这是一种将 Delta Debugging Minimization (DDMIN) 与 Spectrum-Based Fault Localization (SBFL) 相结合的技术。它可以应用于……
在云环境中,resource autoscaling 机制依赖于准确的 performance metrics,以做出最佳的 provisioning decisions。当 infrastructure faults …
机制设计对联邦学习(FL)至关重要,通过协调自利的客户端来最大化社会福利。然而,现有机制往往…
我们部署了一个具备 ReAct 推理和完整数据访问的 LLM 代理。它运行无误,但当被问及“为什么完成率是 80%?”时,它返回了指标……
协同感知(Collaborative perception,CP)是自动驾驶和智慧城市等应用中的关键技术。它涉及信息的共享和融合……
近期在大型语言模型(LLMs)方面的进展已经实现了对各种软件工程任务的自动化,并出现了用于评估其能力的基准测试。