[Paper] SPARC:场景规划与推理用于自动化 C 单元测试生成
对于 C 语言而言,Automated unit test generation 仍然是一个巨大的挑战,因为 high-level program intent 与 rigid syntactic constraint 之间存在 semantic gap……
对于 C 语言而言,Automated unit test generation 仍然是一个巨大的挑战,因为 high-level program intent 与 rigid syntactic constraint 之间存在 semantic gap……
AI agents 正在越来越多地被部署来执行重要任务。虽然在 standard benchmarks 上不断上升的 accuracy scores 暗示了快速的进展,但许多 agents 仍然 co...
聚合物文献包含大量且不断增长的实验知识,但其中许多埋藏在非结构化文本和不一致的术语中,maki...
稀有事件采样问题长期以来一直是分子动力学(MD)的核心限制因素,尤其是在生物分子模拟中。最近,扩散…
大型语言模型(LLMs)正日益被用作自然语言生成评估的自动评估器,通常采用成对比较判断……
对大型语言模型(LLMs)的需求日益增长,要求服务系统能够处理大量并发请求,并满足多样化的服务水平目标(SLOs)。Th...
快速增长的上下文长度导致人们假设大型语言模型(LLMs)可以直接对整个代码库进行推理。与此同时,最近……
大型语言模型(LLMs)可以将自然语言转换为优化代码,但静默失败构成了关键风险:代码在执行后返回 sol...
表面对齐假设(SAH)认为,大型语言模型在预训练期间学习了大部分知识,而后训练仅仅是…
虽然近期在humanoid locomotion方面取得了在各种地形上实现stable walking的进展,但捕捉高度动态的人类运动的agility和adaptivity仍然是一个挑战。
Machine learning surrogates 正在工程领域中被越来越多地用于加速昂贵的仿真,但训练与部署之间的分布漂移常常……
近期深度强化学习(RL)的进展在高维控制任务上取得了显著成果,但将RL应用于可达性问题仍然面临挑战……