[论文] 使用大型语言模型和说服策略检测获胜论点
在论证性文本中检测说服是一项具有重要意义的挑战性任务,对理解人类交流具有重要影响。本研究调查了 r...
在论证性文本中检测说服是一项具有重要意义的挑战性任务,对理解人类交流具有重要影响。本研究调查了 r...
大型语言模型(LLMs)已成为进化搜索的强大操作器,然而高效搜索支架的设计仍然是临时的。虽然 prom...
我们研究具有多个属性的 LTLf 合成,其中满足所有属性可能是不可能的。我们不是枚举属性的子集,而是计算……
最近在视频模型方面取得了巨大的进展,尤其是在长视频理解方面。然而,当前的基准测试主要呈现……
大型语言模型(LLMs)可以通过对其输出表达置信度来提升用户的感知信任。然而,先前的研究表明,LLMs往往 o...
在本文中,我们发现3D人体动作和2D人体视频的生成本质上是耦合的。3D动作为合理性提供结构先验……
当今最强的视频语言模型(VLM)仍然是专有的。最强的开源权重模型要么依赖于来自专有 VLM 的合成数据,有效地……
自适应视频流在过去几年中促进了视频流的改进。需要在比特率、视频质量等编码性能目标之间取得平衡……
Talking head generation 在虚拟现实(VR)中变得日益重要,尤其是在涉及多轮对话的社交场景中。现有方法……
在多智能体多臂赌博机(MA-MAB)的背景下,公平性通常被简化为结果:最大化福利、降低不平等或平衡效用……
从视觉观察中推断物理动作是推动 machine intelligence 在物理世界中发展的基本能力。实现这一点需要…
Large Language Models (LLMs) 已经展现出卓越的能力,但仍然容易受到旨在绕过 safety guardrails 的对抗性 “jailbreak” 攻击。
在资源受限的边缘设备上部署基于 Python 的 AI 代理会面临运行时优化的挑战:需要大量线程来掩盖 I/O 延迟,但 Python 的 Global Interpreter Lock(GIL)阻止了真正的并行执行,导致 CPU 利用率不佳。为了解决这一问题,我们提出了一种混合执行模型,结合多进程(multi-process)和多线程(multi-threading)策略:对 CPU 密集型任务使用 Python 的 multiprocessing,对 I/O 密集型操作则在独立线程中使用异步 I/O(asynchronous I/O)。这种方式能够绕过 GIL 处理计算密集型工作负载,并高效地将 I/O 与计算重叠,从而在受限硬件上提升整体吞吐量。我们在 Raspberry Pi 4 上部署了实时目标检测流水线(object detection pipeline),实验表明该模型相较于纯多线程实现实现了 2.5 倍的加速,同时保持了低内存开销。
条件语言模型的内在评估指标,如 perplexity 或 bits-per-character,已在单语和多语环境中被广泛使用……
对大型语言模型(LLMs)进行选择性知识擦除对于遵守GDPR以及模型安全至关重要,然而当前的unlearning方法将行为抑制与真正的…混为一谈。
多智能体系统 (MAS) 通过协调多个代理实现复杂推理,但由于多步执行和重复... 常常导致高推理延迟。
研究材料的光电子结构可能需要计算伪厄米 Hamiltonian 的数千个最小特征对。
大型语言模型(LLMs)在自然语言任务中取得了令人印象深刻的表现,并且正日益在真实世界的应用中部署。尽管...
大型语言模型正日益用于代码生成和调试,但它们的输出仍可能包含来自训练数据的错误。Dist...
AI agent frameworks 的兴起引入了 agent skills,即包含指令和 executable code 的 modular packages,能够动态扩展 agent 的能力……
尽管 transaction throughput 已经开发超过15年,仍然是区块链面临的关键挑战之一,通常其上限为……
在人工智能领域,实数参数单目标优化是一个重要方向。差分进化(Differential Evolution,DE)和Co...
AI-powered coding assistants 正在快速成为专业 IDE 中的常规工具,但它们对日常开发的持续影响仍然了解不足……
当前的 IDE 内部 AI 编码工具通常依赖耗时的手动提示和上下文管理,而主动的替代方案则能够预判开发者……