[Paper] PICon:用于评估Persona Agent一致性的多轮询问框架
基于大型语言模型(LLM)的角色代理正被快速采用,作为跨多个领域的人类参与者的可扩展代理。然而,目前尚无系统…
4628 posts from this source
基于大型语言模型(LLM)的角色代理正被快速采用,作为跨多个领域的人类参与者的可扩展代理。然而,目前尚无系统…
修复有缺陷的量子电路具有挑战性,需要自动化的解决方案。我们提出了 QRep,这是一种自动化修复方法,能够迭代地识别和……
On-policy distillation(OPD)在大语言模型(LLM)后训练中具有吸引力,因为它在学生生成的 rollouts 上评估 teacher feedback,而不是…
自动化事件管理对微服务可靠性至关重要。虽然最近的统一框架利用多模态数据进行联合优化,但它们未……
我们通过比较人类撰写的叙事与视觉语言模型(VLMs)在 Vis… 上生成的叙事,来研究视觉基础故事中的叙事连贯性。
Neuroevolution 自动化了神经网络设计这一复杂任务,但常常忽视了进化模型固有的对抗脆弱性,这成为了……的障碍。
在 Kubernetes 中迁移有状态微服务需要仔细的状态管理,因为容器重启时内存中的状态会丢失。对于 StatefulSet‑mana…
每个软件组织都面临 onboarding 挑战:帮助新人在复杂的 codebases 中导航,弥补文档不足,并且 compreh...
准确预测 GPU 工作负载对 AI 基础设施至关重要,能够实现高效的 scheduling、resource allocation 和 power management。现代工作负载…
我们研究在分布式计算的 mathsf{CONGEST} 模型中的最小权重环(MWC)问题。对于无向加权图,我们设计了一种随机…
我们在分布式计算的 mathsf{CONGEST} 模型中研究最小权重环(MWC)问题。对于无向加权图,我们设计了一种随机…
联邦学习(Federated Learning,FL)是一种在协作环境中训练机器学习(ML)模型的范式,同时通过将原始数据保留在本地来保护参与者的隐私。
大型语言模型(LLMs)的出现催生了编程范式的转变,产生了“vibe coding”,用户可以构建完整的项目……
随着 AI 助手逐渐融入物理 AI 系统的安全工程工作流程,一个关键问题出现:AI 辅助是否能够提升安全分析……
公共区块链在监管合规性与用户隐私之间固有地存在张力。现有的链上身份解决方案需要中心化的 KYC 证明……
背景:AI-assisted code generation tools 的快速采用,例如 large language models (LLMs),正在改变软件开发实践。虽然…
多模态大语言模型(MLLMs)通过在统一架构中整合文本、图像和音频理解,取得了显著进展。Ho...
最近的进展表明,自我进化的 LLM 代理在程序修复和科学发现等任务上表现出有效性。在这种范式中,planner L...
现有的多智能体框架允许每个智能体同时规划、执行和评估其自身的行为——我们将这种结构缺陷称为“Logic Mon…”。
许多系统管理运行时(SMR),例如资源管理和功耗管理技术,依赖于服务质量(QoS)指标,如尾部延迟……
我们提出了首个在(广播)拥塞团模型中以多对数轮次采样随机生成树的算法。对于任意常数 c > 0,o…
本文介绍了一种神经网络模型,该模型将多个属性学习为图像,并执行已学习记忆的关联顺序召回。简要……
在实际环境中,有效地分布和存储 erasure-coded 数据于分布式系统是具有挑战性的。实际部署必须应对不可预测的……
脉冲神经网络(SNNs)在类脑计算中前景广阔,但高性能模型仍然依赖于密集的多层架构以及实质性的…
我们介绍了多层欧拉-马鲁亚马(ML-EM)方法,用于计算随机微分方程(SDE)和常微分方程(ODE)的解,使用一系列近似函数 (f^{1},dots,f^{k}) 来逼近漂移项 (f)……
我们介绍 DreamerAD,这是第一个潜在世界模型框架,通过压缩 diffusion sam... 实现对自动驾驶的高效强化学习。
Vision--Language--Action (VLA) 策略在将语言指令和视觉观察映射到机器人动作方面表现出强劲的进展,然而它们的可靠性……
组织中的 Agentic artificial intelligence (AI) 是一个受可靠性和监督成本约束的序列决策问题。当确定性工作流…
我们介绍了 Latent‑WAM,一个高效的端到端自动驾驶框架,通过空间感知和动力学信息实现强大的轨迹规划。
检索增强生成(Retrieval‑augmented generation,RAG)系统正日益用于分析复杂的政策文件,但要实现足够的可靠性以供专家使用仍然是一个挑战……
幻觉仍然是大型语言模型(LLMs)的关键瓶颈,削弱了它们在实际应用中的可靠性,尤其是在检索‑...
心理物理实验仍然是感知图像质量评估(IQA)最可靠的方法,但其成本高且可扩展性有限,促使自动…
精确的可变形软组织 3D 重建对于外科机器人感知至关重要。然而,低纹理表面、镜面高光以及...
机器人操作通常需要记忆:遮挡和状态变化会导致决策时的观测在感知上出现别名,从而使动作选择变得非-Ma...
可伸缩矢量图形(SVG)是技术插图和数字设计的关键格式,提供精确的分辨率独立性和灵活的语义……
场景文字编辑旨在修改自然图像中的文本内容,同时保持视觉真实感和语义一致性。现有方法通常需要 t...
多模态说话人识别系统通常假设在训练和测试期间都能获得完整且同质的音视频模态……
在高维 black-box 环境下进行约束优化非常困难,因为评估成本高昂、缺乏梯度信息以及复杂的可行性……
虽然大规模预训练已经彻底改变了语言建模,但其在结构化电子健康记录的医疗领域的潜力仍未得到充分探索……
我们介绍了自由市场算法(FMA),这是一种受自由市场经济启发的新型元启发式算法。不同于遗传算法、粒子群优化,...
视频的密集时序特性对自动分析构成了巨大的挑战。尽管使用了强大的 Vision-Language Models,现有方法仍然……
检索增强生成(Retrieval-Augmented Generation,RAG)已经成为一种框架,用于解决大型语言模型(Large Language Models,LLMs)的限制。然而,它的有效性从根本上……
阅读理解对特殊教育需求和残障(SEND)儿童来说是一个重大挑战,往往需要密集的一对一……
Adaptive scaffolding提升学习,但该领域缺乏在authentic tutoring dialogue中衡量它的可靠方法。这一空白已变得更加紧迫。
随着多模态大语言模型(MLLMs)的进步,自治移动 GUI 代理受到了越来越多的关注。然而,现有的方法……
对可解释人工智能(XAI)的研究常常侧重于解释模型的预测。近年来,已经提出了一些方法来解释预测的不确定性……
为了将领域特定或专业知识嵌入预训练的基础模型中,可以使用诸如参数高效微调(parameter efficient fine-tuning)等技术进行微调……
粒子-网格(Particle-in-Cell,PIC)蒙特卡罗(Monte Carlo,MC)模拟是等离子体物理的核心,但在异构高性能计算(HPC)系统上由于过度的 d...