· ai
[论文] 单阶段 Huffman 编码器用于 ML 压缩
训练和服务大型语言模型(Large Language Models (LLMs))需要在多个加速器之间划分数据,其中集合操作经常成为瓶颈……
训练和服务大型语言模型(Large Language Models (LLMs))需要在多个加速器之间划分数据,其中集合操作经常成为瓶颈……
在论证性文本中检测说服是一项具有重要意义的挑战性任务,对理解人类交流具有重要影响。本研究调查了 r...
大型语言模型(LLMs)已成为进化搜索的强大操作器,然而高效搜索支架的设计仍然是临时的。虽然 prom...
我们研究具有多个属性的 LTLf 合成,其中满足所有属性可能是不可能的。我们不是枚举属性的子集,而是计算……
最近在视频模型方面取得了巨大的进展,尤其是在长视频理解方面。然而,当前的基准测试主要呈现……
大型语言模型(LLMs)可以通过对其输出表达置信度来提升用户的感知信任。然而,先前的研究表明,LLMs往往 o...
Agentic 系统和企业搜索依赖于高效且准确的数据检索。数据库提供商 MongoDB 认为其最新的 embeddi...
在本文中,我们发现3D人体动作和2D人体视频的生成本质上是耦合的。3D动作为合理性提供结构先验……
2024年,我有幸与迈阿密海豚队的游泳教练合作,他们着手开展一项任务,以优化他们在水上竞争的优势。
当今最强的视频语言模型(VLM)仍然是专有的。最强的开源权重模型要么依赖于来自专有 VLM 的合成数据,有效地……
自适应视频流在过去几年中促进了视频流的改进。需要在比特率、视频质量等编码性能目标之间取得平衡……
Talking head generation 在虚拟现实(VR)中变得日益重要,尤其是在涉及多轮对话的社交场景中。现有方法……