[Paper] daVinci-Dev:Agent-native Mid-training for 软件工程
最近,大型语言模型(LLM)能力的前沿已经从单轮代码生成转向代理式软件工程——一种……
4740 posts from this source
最近,大型语言模型(LLM)能力的前沿已经从单轮代码生成转向代理式软件工程——一种……
随着区块链技术的出现,提案数量激增。这些区块链提案产生的网络流量增加了...
高效的 entanglement distribution 是 Quantum Internet 的基石。然而,诸如 photon loss、memory coherence time 等物理链路参数……
近年来,Spiking Neural Networks(SNN)取得了显著进展,Spiking Transformers 作为一种有前景的能效架构正在崭露头角。
勒索软件变种日益将特权提升与诸如间歇加密、低熵加密等复杂的规避策略相结合,……
图在科学计算、数据分析和 AI/ML 中用于建模关系是核心的,但它们日益增长的规模可能超出内存和计算能力……
Verilog 的设计周期本质上工作量大,需要广泛的领域专业知识。虽然大型语言模型(LLMs)提供了一条有前景的路径……
我们引入共振稀疏几何网络(Resonant Sparse Geometry Networks,RSGN),一种类脑架构,具备自组织稀疏层次化输入依赖连接。Unli...
审计性和可复现性仍然是实时数据流管道的关键挑战。Streaming engines 高度依赖 runtime scheduling……
尽管最近取得了进展,medical foundation models 仍然难以统一 visual understanding 和 generation,因为这些任务本质上目标冲突……
Frontier LLMs 正在学术界、社会和工业界中越来越多地被使用。一个常用的单位用于比较模型、它们的输入和输出,以及估计…
大型推理模型(LRMs)在解决问题的过程中会生成文本形式的思考链(CoT),这是一种潜在的强大工具,用于……
前沿语言模型的能力正在快速提升。因此,我们需要更强有力的缓解措施,以防止恶意行为者滥用日益强大的系统。Prior w...
最近在3D形状生成方面的进展取得了令人印象深刻的成果,但大多数现有方法依赖于干净、未被遮挡且分割良好的输入。这种...
虽然使用 formal methods 相较于 unit testing 有优势,但其陡峭的学习曲线可能令开发者望而却步,并且可能成为广泛采用的主要障碍。
室内环境会随着物体的移动、出现或消失而演变。捕捉这些动态需要在整个过程保持时间上一致的实例身份……
在现有的1型糖尿病(T1D)管理数据集之间的碎片化和缺乏标准化限制了T1D算法开发的进展。Cur...
Smart grid 基础设施已经彻底改变了能源分配,但其日常运营需要强大的 anomaly detection 方法来应对风险……
我们通过条件风险框架研究差分进化(DE)中的首次命中时间。我们并非通过马尔可夫链转移来分析收敛性……
AI agents 融入经济市场从根本上改变了战略互动的格局。我们研究了…
竞技体育需要复杂的战术分析,但拳击等格斗项目在 AI 驱动的分析方面仍显不足,原因在于其复杂性……
抽取式摘要(Extractive summarization,ES)旨在通过从文档中选择子集句子来生成简洁的摘要,同时最大化相关性并最小化 re…
在 generative AI 时代,即使关键的医疗任务也日益实现自动化,radiology report generation (RRG) 仍然依赖于 suboptimal metric……
消息传递遵循因果顺序(causal delivery)是分布式系统中最经典且最广泛有用的进程间通信抽象之一。
埃塞俄比亚卫生部正在升级卫生站,以改善对基本服务的获取,特别是在农村地区。然而,资源有限,需要……
Vision-Language-Action(VLA)模型正逐渐成为端到端自动驾驶系统中极为有效的规划模型。然而,当前的工作大多…
我们提出了一种新颖的 probabilistic approach 用于 optimal path experimental design。在该方法中,discrete path optimization problem 被定义在 static navigation 上……
Transformer 预训练正日益受到内存和计算需求的限制,键值(KV)缓存已成为训练期间的主要瓶颈。
Predictive Process Monitoring 是 process mining 的一个分支,旨在预测正在进行的过程的结果。最近,它利用机器学习和深度学习……
随着视觉语言模型(VLMs)处理日益复杂和多模态的任务,键值(KV)缓存的快速增长对内存和计算资源提出了显著的压力……
从人类示范中学习结构化任务表征对于理解长时程操作行为,尤其是双手协作的情况,至关重要。
信息过载和错误信息在从大型新闻集合中提取有意义的叙事时带来了重大挑战。本文定义了na...
大型畜牧业对人类健康和环境构成重大风险,同时也易受到诸如传染病等威胁。
Diffusion models 现在能够生成高质量、多样化的样本,且对更强大模型的关注日益增加。虽然 ensembling 是一种众所周知的提升方法……
检索增强生成(Retrieval‑Augmented Generation,RAG)已成为一种强大的方法,通过整合……提升大型语言模型的问答能力。
我们提出了 Map2Thought,一个能够为 3D VLM 提供显式且可解释的空间推理的框架。该框架基于两个关键组件:Metr...
大型语言模型(LLMs)在各个领域表现出卓越的性能,但它们面临着关键的安全问题。模型编辑已经成为一种有效的…
我们报告了大型语言模型(LLMs)在理解“Jabberwocky”语言方面的惊人能力,在这种语言中,大多数或全部内容词已被随机……
本白皮书概述了“technical debt”主题,并提出了一种在团队中管理 technical debt 的方法。本白皮书基于…
PubMed-OCR 是一个以 OCR 为中心的科学文章语料库,来源于 PubMed Central Open Access PDFs。每页图像都使用 Google Cloud Vision 进行标注……
背景与动机。在线用户反馈是需求工程的宝贵资源,但其数量庞大且噪声较多,使得分析变得困难。现有的…
三维装箱问题(3D-BPP)是运筹学和物流领域长期存在的挑战。经典启发式算法和构造方法……
GitHub 原生支持通过 GitHub Actions 实现工作流自动化。然而,工作流的维护常常被软件开发者视为一种负担,他们经常……
脉冲神经网络(SNN)采用受神经可塑性启发的无监督学习方法,有望成为人工智能的新框架。
Function-as-a-Service(FaaS)已成为无服务器云计算的核心范式,但优化 FaaS 部署仍然具有挑战性。使用函数 fu...
我们研究 bots 如何在 Ethereum 生态系统的开源讨论中做出贡献,以及它们是否会影响开发者的情感基调。我们的数据集覆盖了36,8...
大型语言模型(LLMs)向自主代理的演进已经将 AI 编码的范围从局部代码生成扩展到复杂的、仓库级…
高维投资组合优化在复杂约束下面临显著的计算挑战,传统优化方法难以应对 t...