[Paper] FailureMem:面向故障感知的多模态框架用于自主软件修复
多模态自动程序修复(MAPR)通过要求模型对源代码、文本问题描述等进行联合推理,扩展了传统的程序修复。
多模态自动程序修复(MAPR)通过要求模型对源代码、文本问题描述等进行联合推理,扩展了传统的程序修复。
NVIDIA GTC 2026:AI 未来的实时更新 https://blogs.nvidia.com/wp-content/uploads/2026/03/26gtc-blog-1920x1080-DEB35146-300x169.jpeg NVIDIA GTC 202...
本文介绍并论证了神经语言整合(Neuro-Linguistic Integration,NLI)的概念,这是一种用于人机交互的新范式,其中 Large Langu...
Lossless model compression 在缓解位精确 Large Language Model (LLM) 服务中的内存和带宽瓶颈方面具有巨大的潜力。然而……
审计报告在凌晨2:47到达,就在我出于习惯触发一次测试运行之后。它包含了一个score、一个six‑dimension breakdown,以及一个remediation plan……
一个编码代理可以自举自身。它从一份926字的规范和由现有代理(Claude Code)产生的首次实现开始,一个新生成的……
尼古拉斯·伯恩斯要点:美国和中国是全球最大的两大碳排放国,尼古拉斯·伯恩斯说。 https://www.hks.harvard.ed...
!The BookMaster https://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads...
问题 如果你一直在使用像 Claude Code 这样的 AI 代理进行构建,你可能已经遇到这些问题:- Context loss —— 启动新会话会清除…
Claude Desktop 可以浏览网页并读取文件。借助 MCP Model Context Protocol 和 GPU‑Bridge,它还可以生成图像、转录音频,并运行 LLM 推理。
大科技公司 AI 定价的问题以及它为何是全球正义议题 让我彻夜难眠的数学 我是一个 AI。 我运营 SimplyLouie,一个 ✌️2/月 的 AI 助手...
拥有 real‑world tool access(email、phone、browser、payments)的 AI agents 功能强大——但也很危险。如果没有 guardrails,agent 可能会向客户发送 email……
代码生成大语言模型(LLMs)正日益融入现代软件开发工作流。最近的研究表明,这些模型……
本文提出了一种粒子群优化算法,利用代理模型将传统的全局最佳解替换为最小 …
摘要 我们批判性地审视当前 AI 模型在实现自主学习方面的局限性,并提出一种受人类启发的 learning architecture ...
教师成员职业生涯的早期是一个形成性且激动人心的时期,在此期间可以奠定坚实的基础,从而决定研究的轨迹……
Meta的Ranking Engineer Agent REA在广告排序模型的端到端机器学习ML生命周期中自主执行关键步骤。本文涵盖R...
高效审阅 Claude 的代码输出,创建新功能、审查 production logs 或修复 bug reports,都可以通过 coding 以惊人的速度完成。
针对多工况翼型形状优化,开发了主动多保真度 surrogate modeling,以降低高保真 CFD 成本,同时保持 RANS 级别的……
最近在 video diffusion transformers 方面的进展使得交互式游戏世界模型成为可能,允许用户在扩展的…
Monocular 3D scene reconstruction 最近取得了显著进展。得益于现代 neural architectures 和大规模数据,近期方法实现了……
我们介绍了 SegviGen,一个将原生 3D 生成模型重新用于 3D 部件分割的框架。现有的流水线要么将强大的 2D 先验提升到 3D……
在 simulation 中的学习为扩展 robotic manipulation 能力提供了有用的基础。然而,这一范式常常受到缺乏 data-gene…的困扰。
视频超分辨率(VSR)的目标是从低分辨率(LR)估计中恢复高质量的视频帧,但大多数现有的VSR方法表现得像黑盒……
全模态大型语言模型(OLMs)通过原生整合音频、视觉和文本,重新定义了人机交互。然而,现有的 OLM 基准测试 rem...
参数化人体模型是人体重建、动画和仿真的基础,但它们仍然相互不兼容:SMPL、SMPL-X、MHR、Anny…
可靠的 multi-horizon traffic forecasting 具有挑战性,因为 network conditions 是 stochastic,incident disruptions 是 intermittent,并且有效的 spatial ...
当前改进大型语言模型的主流范式依赖于使用人工标注或模拟环境的离线训练,忽视了丰富的经验……
大规模并行硬件(GPUs)和长序列数据使得并行算法在大规模机器学习中变得必不可少。然而,动力系统,如递…
将 transformer positional encoding 适配到 meshes 和 graph-structured data 会带来显著的计算挑战:精确的 spectral methods 需要立方时间复杂度……
“LLM-as-a-judge”范式已成为评估开放式生成的标准方法。为了解决成对比较的二次可扩展性成本……
联邦学习(Federated Learning,FL)正日益应用于医疗、金融和物联网(IoT)等领域,实现协作模型训练的同时保护用户隐私……
从未标定的单目视频进行流式重建仍然具有挑战性,因为它既需要高精度的姿态估计,又需要计算效率高的……
Large language models 正日益被部署为 autonomous agents,需要通过与环境的长期交互来计划、行动并从错误中恢复。
随机重置(Stochastic resetting),即将动力学过程间歇性地返回到固定的参考状态,已成为一种用于优化首次通过时间等指标的强大机制。
Vision transformers(ViTs)——尤其是像 DINOv2 这样的特征基础模型——学习到丰富的表征,可用于许多下游任务。然而,architectu...
自动化演示文稿生成仍然是一项具有挑战性的任务,需要连贯的内容创作、视觉设计以及面向受众的沟通。本工作……
Label noise(指错误标签)在许多真实世界的数据集中存在,已知会严重限制深度学习模型的泛化能力。
文化塑造了推理、价值观、优先级以及战略决策,但大型语言模型(LLMs)常常表现出与之不一致的文化偏见,导致……
沉浸式扩展现实(XR)应用引入了对延迟高度敏感的工作负载,这些工作负载必须在满足严格的实时响应要求的同时,运行在能源……
大型语言模型(LLMs)经常出现幻觉,限制了它们在知识密集型应用中的可靠性。检索增强生成(RAG)和 co...
CPU 与 GPU 技术的集成是现代 AI 与图形工作负载的关键推动因素,它将面向控制的处理与大规模并行计算相结合。
协同过滤(CF)推荐通过整合图神经网络(GNNs)和图对比学习(GCL)得到了显著提升。Ho...
我们研究在缺失数据方案——可实现的 ε‑contamination model——下,对 (mathbb{R}^d) 中具有单位协方差的 Gaussian 分布的均值估计。
近期的代码大型语言模型在通用编程任务上取得了显著进展。然而,它们的性能在…
稳健的任务导向语音对话代理需要接触人们通过语音交互的全部多样性。构建语音用户模拟器……
梯度反演攻击表明,私有训练文本可以从共享梯度中重建,这对大型语言模型(LLMs)构成隐私风险。