[Paper] MTRAG-UN:多轮 RAG 对话中开放挑战的基准
我们提出了 MTRAG-UN,这是一项用于探索多轮检索增强生成(multi-turn retrieval augmented generation)中的开放挑战的基准,后者是大型语言模型的热门应用。我们发布了 …
我们提出了 MTRAG-UN,这是一项用于探索多轮检索增强生成(multi-turn retrieval augmented generation)中的开放挑战的基准,后者是大型语言模型的热门应用。我们发布了 …
深度学习(DL)库被广泛用于关键应用,即使是细微的静默错误也可能导致严重后果。虽然现有的 DL fuzz …
大型语言模型(LLM)服务基础设施正经历向异构化和解耦的转变。现代部署越来越多地集成了多…
在诸如寿命超声心动图等安全关键领域应用基于LLM的多代理软件系统会引入无法解决的系统级风险。
本文通过利用一种基于对称性原理的新型 primitives 类别——isotropic activation functions,提出了一种用于 dynamic networks 的创新方法。该...
现代 multi-tenant、hardware-heterogeneous 计算环境对有效的 workload orchestration 构成了重大挑战。简单的启发式方法用于评估……
Hybrid work 已成为后疫情时代的现实,正在改变 Agile 团队交付价值、协作和适应的方式。本研究调查混合环境中的……
种子爆炸是模糊测试种子调度中的一个根本性问题,在这种情况下,fuzzer 维护一个庞大的 corpus,却未能挑选出有前景的种子。现有工作 f...
Vision-Language-Action (VLA) 模型是多模态机器人任务控制器,给定指令和视觉输入后,生成一系列低层控制指令。
AI 编码代理的演进已经将前沿从简单的代码片段补全转向自主的仓库级工程。然而,评估这些 …
从非结构化点云数据中对动态3D对象进行时间一致的表面重建仍然具有挑战性,尤其是对于非常长的序列。E...
Egocentric manipulation videos 在交互过程中由于严重遮挡以及物体频繁进入和离开摄像头视野而极具挑战性……