· ai
[Paper] 自信的幻觉?通过邻域一致性诊断 LLM 真实性
随着大型语言模型(LLMs)在真实世界环境中日益部署,仅仅正确性已不足以满足需求。可靠的部署需要保持 tr...
随着大型语言模型(LLMs)在真实世界环境中日益部署,仅仅正确性已不足以满足需求。可靠的部署需要保持 tr...
大型语言模型(LLM)路由旨在利用不同 LLM 在多样任务中的专门优势。然而,现有方法通常侧重于…
偏好调优通过对显式偏好信号进行优化,使预训练语言模型与人类对质量、帮助性或安全性的判断保持一致,而不是……
近期的深度伪造检测方法越来越多地探索频域表示,以揭示在时域中难以检测的操纵伪影。
半监督医学图像分割是一种有效的方法,用于应对标注数据有限的场景。现有方法主要依赖于框架……
我们提出了一种新颖的框架,将任意姿态的人体分解为可动画的多层 3D 人体化身,并实现身体与服装的分离。Conventi...
去中心化金融(DeFi)质押是 DeFi 生态系统中最突出的应用之一,DeFi 项目使用户能够在 th... 上质押代币。
管理迭代求解器(iterative solvers)在稀疏线性系统(sparse linear systems)中的高计算成本是科学计算中已知的挑战。此外,科学应用…
Software engineering (SE) agents 由 large language models 驱动,正日益在实践中被采用,但它们往往会产生巨大的金钱成本。我们介绍…
漏洞严重威胁软件系统,使及时应用 security patches 对于缓解 attacks 至关重要。然而,software vendors …
我们推出 AutoMonitor‑Bench,这是第一个旨在系统评估基于 LLM 的不当行为监控器在多样任务中可靠性的基准。
现代软件系统日益复杂,使得理解其行为变得越来越具有挑战性,推动了对可解释性的需求以提升……