[Paper] CoT 不是真相链:对用于假新闻生成的推理 LLM 的实证内部分析
从生成标题到捏造新闻,Large Language Models (LLMs) 通常在安全假设的前提下,通过它们的最终输出进行评估。
3122 posts from this source
从生成标题到捏造新闻,Large Language Models (LLMs) 通常在安全假设的前提下,通过它们的最终输出进行评估。
大型语言模型在闭卷问答中常常难以识别自身的知识限制,导致自信的幻觉。虽然分解...
线性注意力提供了一种计算效率高且表达能力强的替代方案,相比于 softmax 注意力。然而,最近的实证结果表明,状态 o...
Pose 和 motion priors 在 humanoid robotics 中发挥关键作用。虽然这些先验已在 human motion recovery (HMR) 领域得到广泛研究,范围……
量子化学是化学、材料科学、计算生物学等领域的基础性工具。尽管它功能强大,...
我们提出 El Agente Estructural,这是一种多模态、自然语言驱动的几何生成与操作代理,用于自主化学和分子建模……
Reasoning language models(生成长链思考的模型)在抽象问题上显著超越 non‑reasoning language models。然而,...
随着3D扫描技术的进步,点云已成为表示3D空间数据的基础,应用范围遍及各种……
我们对神经网络的理论理解落后于其经验成功。一个重要的未解释现象是,为什么以及如何,在…
软件工程(SE)面临来自 AI 自动化(降低代码生产成本)和硬件‑能源约束(放大故障成本)的双重压力……
静态注解类型已被证明能够帮助开发者完成许多编程任务,即使在没有静态类型检查的情况下,这一好处仍然成立。
人类指甲疾病在所有年龄段逐渐被观察到,尤其是在老年人中,常常被忽视,直到病情严重。早期检测……
在常规结肠镜筛查中,对癌前息肉进行准确的风险分层对于降低结直肠癌(CR...)的发生风险至关重要。
大型语言模型(LLMs)的快速增长已经超出了单GPU硬件的演进速度,使得模型规模越来越受到内存容量的限制。
真正的自我进化要求代理人作为终身学习者,内化新颖的经验以解决未来的问题。然而,严格衡量这一点……
Omni-modal Large Language Models (Omni-LLMs) 已经展示了在音视频理解任务中的强大能力。然而,它们对长多模态……
控制器——管理硬件行为的软件模块——是典型机器人系统的关键组件。虽然控制理论为 s 提供安全保证……
SV-COMP 竞赛提供了一个最先进的平台,用于在标准化的验证任务集合上评估软件验证工具。Consequentl...
自动语音识别(ASR)在会话语音方面仍具挑战性,因为缺乏大规模、标注完善的多说话人对话数据……
构建针对低资源语言的机器翻译(MT)系统尤其困难,因为高质量数据稀缺。虽然大型语言模型...
本研究针对多目标优化问题(MOOPs)的 metaheuristics 开发,解决了两个关键挑战:指数增长……
large language models 的引入点燃了对 software development models 的大规模改造和重新思考。随之而来的 software engineering 的响应……
Spatial accelerators 由 compute‑memory integrated units 阵列组成,为部署 low latency 的 inference workloads 提供了有吸引力的平台,且…
低密度奇偶校验(LDPC)译码是5G 新无线(NR)物理层中计算强度最高的核心之一,必须在…内完成。