[论文] 通过自蒸馏的多标记预测
现有的加速语言模型推理的技术,例如 speculative decoding,需要训练辅助的 speculator 模型并构建和部署…
3122 posts from this source
现有的加速语言模型推理的技术,例如 speculative decoding,需要训练辅助的 speculator 模型并构建和部署…
大型语言模型(LLMs)正日益以零样本方式用于评估心理健康状况,但我们对哪些因素了解有限,...
Thompson 采样(TS)在随机多臂赌博机中被广泛使用,但其在自适应数据收集下的推断属性非常微妙。经典的……
视觉生成模型的快速发展已经超出了传统评估方法的步伐,迫切需要采用 Vision-Language Models 作为替代……
GitHub Security Advisories (GHSA) 已成为开源漏洞披露的核心组成部分,并被开发者和安全工具广泛使用。
基于大型语言模型(LLM)的代理正日益被期望能够自主进行谈判、协调和交易,然而现有的基准缺乏原则性的……
语音情感识别(Speech Emotion Recognition, SER)研究由于缺乏标准且足够大的数据集而受到限制。最近的研究利用了预训练…
扩散大语言模型(dLLMs)已成为文本生成的有前景的替代方案,其特点是原生支持并行解码……
深度研究代理已经成为处理复杂查询的强大系统。与此同时,基于LLM的检索器在fol方面展示了强大的能力。
语义表征可以被构建为一种结构化、动态的知识空间,人类在其中导航以检索和操作意义。为了研究……
广为研究的 DISPERSION 问题是分布式机器人学中的一个基本协作问题,其中一组移动机器人必须重新定位,使得每个占...
长推理模型在多语言环境中常常遇到困难:它们倾向于对非英语问题使用英语进行推理;当被限制在...
多项选择题(MCQs)常用于评估大型语言模型(LLMs)中编码的知识、推理能力,甚至价值观。虽然...
随着大语言模型(LLMs)在复杂推理方面取得突破,基于 Codeforces 的 Elo 评级已成为评估竞争力的突出指标……
DARWIN 是一种进化型 GPT 模型,利用类似遗传算法的优化结构,对多个独立的 GPT 代理进行单独训练……
我们考虑带有 advice 的分布式 wake‑up 问题,其中节点配备了关于整体网络的初始知识。在对手唤醒之后……
代码补全(Code completion,CC)是开发者在与基于 LLM 的编程助手协作时常用的任务。尽管性能有所提升……
本工作研究了自动 AI 代理优化方法在形式验证环境中对真实世界代理的适用性,重点关注自动定理证明……
量子威胁对网络安全的冲击加速了后量子密码学(Post-Quantum Cryptography,PQC)的标准化。将遗留软件迁移到这些量子安全的algo……
Pipeline parallelism 使得训练超出单设备内存限制的模型成为可能,但实际吞吐量仍受到 pipeline bubbles 的限制。虽然 parameter …
非侵入式负荷监测(Non‑Intrusive Load Monitoring,NILM),通常称为 energy disaggregation,旨在通过分析整体负荷来估计各个电器的功耗。
在本文中,我们提出了一种受神经启发的 reservoir computing (RC) 方法,其中体外培养的皮层神经元网络作为物理……
从 CVE 描述自动复现漏洞需要生成可执行的概念验证(Proof-of-Concept,PoC)利用代码,并在目标环境中进行验证。
背景:AI-assisted tools 正日益集成到 software development workflows 中,但它们对 large language models (LLMs) 的依赖引入了 …