[论文] 修订还是重新求解?分解多LLM流水线中二次传递收益
多模型(Multi-LLM)修订流水线,其中第二个模型审阅并改进第一个模型生成的草稿,普遍认为其收益来源于真正的 er...
4611 posts from this source
多模型(Multi-LLM)修订流水线,其中第二个模型审阅并改进第一个模型生成的草稿,普遍认为其收益来源于真正的 er...
持续集成与交付(CI/CD)流水线对于维持大型软件系统的演进至关重要。在受监管的行业中,面对遗留的...
医学成像技术,尤其是磁共振成像(MRI),被公认为神经系统疾病诊断和治疗计划的金标准……
L∞星差距是衡量点集在给定空间中分布均匀程度的指标。低星差距的点集被用于设计……
从头预训练大型语言模型(LLMs)需要巨量的计算资源。Aurora 超级计算机是一台 ExaScale 机器,拥有 127,488 个 Intel PVC(P…)。
Gaussian processes 在 machine learning 领域被广泛使用,但仍然计算量大,限制了它们在各种硬件上的高效可扩展性。
我们在 LOCAL 中获得了用于计算更平衡的定向和度分割的更好算法。我们结果的重要因素是与 hypergraph sinkl… 的关联。
Neural Architecture Search (NAS) 已成为自动机器学习中的关键技术。基于进化算法 (EA) 的方法展示了卓越的……
经典-量子系统的异构性(不同的数据特性、执行范式和同步机制等)使得现有的分布式……
当 MPI 并行仿真在共享的 Kubernetes 集群上运行时,传统的 CPU 调度会使大多数已分配的周期在同步时处于空闲状态……
现代 GPU 集群建立在复杂的异构互连层次结构之上,范围从多轨 RDMA 到专有的织物,例如 Multi-Node NV……
分析具有可稳定受控不变集(CISs)的非线性系统,需要准确估计它们的稳定域(DOS)以及…
Long-context decoding 在 LLM 中是 IO‑bound:每个 token 会重新读取不断增长的 KV cache。之前的加速通过 compression 来削减字节,但这会降低 fidelity,o...
癫痫发作是一种神经系统疾病,其特征是大脑中异常且过度的电活动,导致复发性的发作事件。E...
分布式应用需要满足存储效率、时间顺序可排序、嵌入来源元数据、零查询可验证、conf...
使用视频生成模型对场景进行建模近年来已引起日益增长的研究兴趣。然而,大多数现有方法依赖于透视视频……
视频扩散模型展现出诸如解迷宫和拼图等新兴推理能力,但人们对它们在生成过程中的推理方式知之甚少……
自动并行化仍然是软件工程中的一个挑战性问题,尤其是在识别可以安全执行循环的代码区域时……
AI辅助编码已迅速重塑软件实践和研究工作流,但当今的模型仍然难以为复杂的三维地质力学代码生成正确的结果。
本研究探讨了在成本感知的大语言模型(LLM)路由中使用 NeuralUCB。现有的路由方法大致可分为监督…
对多头自注意力(MHA)中 self-attention 机制内存占用的降低的追求催生了一系列丰富的方法,例如,gro...
人类说话者常常通过整体放慢语速来帮助那些在语言理解上有挑战的听众,例如听力受限或非母语的成年人。
当前的自主 AI 代理主要由大型语言模型(Large Language Models,LLMs)驱动,处于认知轻盈状态:它们在没有…
Verifiable claim detection 询问一个主张是否表达了一个事实陈述,原则上可以依据外部证据进行评估。作为一种早期过滤……
本文提出了一种新的混合框架,将强化学习(RL)和大型语言模型(LLMs)相结合,以提升机器人操作任务。B...
我们提出了一种简单的检测机制,用于Aaronson(2022)提出的Gumbel水印方案。新的机制已被证明在概率上接近最优……
AI 代理,主要由大型语言模型(LLMs)驱动,容易受到间接提示注入的影响,即在不可信…
生产与分布式分析(PanDA)系统,最初为 CERN 大型强子对撞机(LHC)上的 ATLAS 实验开发,已发展为 …
伪装目标检测(Camouflaged object detection,COD)旨在识别与背景高度融合的目标。近期研究表明,optical characteristics……
Mechanistic interpretability (MI) 是一种新兴的神经网络解释框架。给定任务和模型,MI 旨在发现简洁的算法式 …
Aggregate programming 是一种基于场的协同范式,已有十多年的探索,并在包括传感器网络在内的多个领域取得了成功的应用。
类比推理是人类在问题解决和论证中实现概括的关键驱动力。然而,叙事结构之间的类比仍然具有挑战性……
Myopic Optimization with Non‑myopic Approval (MONA) 通过限制代理的规划视野,同时提供远见的 …
增强现实(AR)设备配备头戴显示器(HMD),能够在手术期间将三维术前影像数据直接叠加到患者身上。
Cross-validation (CV) 通常用于在没有独立测试数据时估计预测风险。它的有效性取决于假设有效……
AI 驱动的搜索引擎的激增已经将信息发现从传统的基于链接的检索转变为直接答案生成,并带有选择性……
多模态深度学习在癌症预后中的应用通常被认为能够受益于协同的跨模态交互,但这一假设尚未直接……
准确的空气污染预测对于环境监测和政策支持至关重要,然而数据驱动模型往往受到有限的泛化能力限制。
科学家经常想解释为什么两个组的结果不同。例如,两家医院的患者死亡率差异可能是由于……
Multimodal deep learning 通过整合 histopathology 和 genomic data 提高了脑肿瘤的预后准确性,然而 volumetric M...
理解大脑结构与功能的相互作用是解释智力的关键,但将它们联合建模具有挑战性,因为结构和功能……
Surgical video understanding 对于 computer-assisted interventions 至关重要,然而现有的 surgical foundation models 仍受限于数据规模有限,...
外科手术本质上复杂且风险高,需要广泛的专业知识和持续的专注,以便在不断变化的术中场景中顺利导航。Computer...
对有药物使用启动风险的青少年进行早期识别至关重要,但却很困难,因为大多数预测因素将连通性视为静态或交叉……
最近在推理大型语言模型(LLMs)方面的进展主要依赖于前置思考,即在给出最终答案之前进行推理。然而,这...
有效的协作需要团队通过社会共享学习调节(Socially Shared Regulation of Learning,SSRL)来管理复杂的认知和情绪状态。Physiological syn...
本文研究了多语言新闻报道中的句子级文本复用,分析了复用内容在文章中的出现位置。我们提出了一种弱监督方法……
随着工业中的 software 规模和复杂性增长,公司生成和使用的 engineering data 量也随之增加。理想情况下,这些数据可以用于 f...