[Paper] 量子软件可分析性模型的验证:一系列实验
混合软件的可分析性——该软件集成了经典和量子组件——是确保其可维护性和工业采用的关键因素。
4654 posts from this source
混合软件的可分析性——该软件集成了经典和量子组件——是确保其可维护性和工业采用的关键因素。
医学图像处理需要专门的软件来处理高维体积数据、异构文件格式以及领域特定的训练……
对“标准”LOCAL模型的常见定义往往在一点上显得马虎甚至自相矛盾:节点是否使用任意的 … 来更新它们的状态。
要充分利用 AI agents 在软件开发中的能力,需要重新思考软件生态系统本身。为此,本文概述了 …
互联网测量面临双重挑战:复杂的分析需要专家级的工具编排,然而即使是语法上正确的实现也可能会…
在新发布的软件框架的背景下,大型语言模型(LLMs)往往表现不佳,并且出现高比例的 hallucination,因为它们是 n...
随着大型语言模型(LLMs)日益融入软件开发工作流,它们的可信度已成为一个关键问题。然而,i...
在分布式大模型训练中,将通信与计算重叠至关重要,但对其进行优化——尤其是当计算成为瓶颈时——仍然是一个挑战。
真实世界的碰撞报告,结合文本摘要和草图,对于自动驾驶系统(ADS)的基于场景的测试非常有价值。然而,cu...
Task-based runtime systems 为并行科学应用提供灵活的负载均衡和可移植性,但它们的强扩展性对……高度敏感。
Federated Learning(FL)实现了一种分布式的客户端‑服务器架构,多个客户端在该架构下协同训练全局机器学习(ML)模型,而无需共享原始数据。
统一的多模态模型能够在单一架构中同时理解和生成视觉内容。然而,现有模型仍然对数据需求量大,且过于……
我们提出 tttLRM,这是一种新颖的大规模 3D 重建模型,利用 Test-Time Training (TTT) 层实现长上下文、自回归的 3D 重建……
当前的前馈 3D/4D 重建系统依赖于 dense geometry 和 pose supervision —— 在大规模下获取成本高昂,且在动态场景中尤为稀缺……
LLM 代理正快速演进,得益于代码执行、工具以及最近推出的 agent skills 功能。Skills 允许用户扩展 LLM 应用程序……
我们研究已训练分类器集合的后校准不确定性。具体而言,我们同时考虑 aleatoric(标签噪声)和 epistemic(模型)不确定性。
从真实世界观测中估计可用于仿真的场景对于下游的规划和策略学习任务至关重要。遗憾的是,现有方法stru...
Mean Field Games (MFGs) 为建模大规模人口模型中的交互提供了原则性的框架:在大规模下,人口动态变为确定性,……
数据可视化规则——源自数十年在设计和感知方面的研究——确保图表传达的可信度。虽然先前的研究已经表明,大...
随着大型语言模型(LLMs)的兴起,它们已在检索增强生成(RAG)等应用中发挥了关键作用。然而,对这些……
流行病学模型日益依赖自我报告的行为数据,例如疫苗接种状态、口罩使用和社交距离遵守情况,以预测……
当前针对大模型推理的强化学习目标主要侧重于最大化期望奖励。该范式可能导致对 dom... 的过拟合。
目标:通过避免不必要的推理,同时保持……,提升使用大型语言模型(LLMs)进行医学问答(MedQA)的效率。
大型语言模型(LLMs)是如何知道它们所知道的内容的?要回答这个问题一直很困难,因为预训练数据往往是一个“黑箱”——未知的……
解决长期任务需要机器人将高层语义推理与低层物理交互相结合。虽然视觉语言模型(VLMs)...
Reinforcement learning with verifiable rewards (RLVR) 已成为一种有前景的方法,通过利用监督… 来训练推理语言模型 (RLMs)。
我们研究由[Goel et al. 2017]提出的对抗注入模型中的在线学习,其中标记样本流主要是独立同分布(i.i.d.)抽取的 f...
对专家注释的依赖长期以来一直是人工智能在生物医学应用中的主要瓶颈。虽然 supe...
误差有界的有损压缩被视为应对当今高性能计算中日益增长的科学数据量的有前景的方法……
检索增强生成(RAG)通过在生成时条件化检索到的外部文档来提升大语言模型(LLMs),但检索的效果……
基于边缘的表征是视觉理解的基本线索,这一原则源于早期的视觉研究,至今仍然是核心。我们扩展了这一…
大型语言模型(LLMs)在人类获取信息的方式中发挥着关键作用。虽然它们的核心用途依赖于理解书面请求,但我们对……
在本研究中,大型语言模型(LLM)的输出被视为一种信息源,生成从有限字母表中抽取的无限符号序列……
现代代码智能代理在超过 100 万标记的上下文中运行——远远超出人类手动定位相关文件的规模。然而,代理仍然……
大型语言模型正在被部署在复杂的 socio-technical 系统中,这暴露了当前 alignment 实践的局限性。我们持有的立场是 d...
LLM 驱动的应用正通过将 large language models 作为复杂任务执行的核心推理组件,迅速重塑软件生态系统。Th...
随着基于 LLM 的多智能体系统(MAS)日益被部署用于复杂任务,确保其可靠性已成为一个紧迫的挑战。由于 MAS 协...
我们引入了一种基于对角化的 Linear Echo State Networks (ESNs) 优化方法,能够降低储层状态每一步的计算复杂度……
随着运营技术日益与信息技术融合,对入侵检测系统的需求变得更加重要。本文探讨……
Git 被广泛用于协作软件开发,但对新手来说可能具有挑战性。虽然大多数学习工具侧重于个人工作流,Git……
Gaussian processes (GPs) 是一种广泛使用的回归工具,但精确求解器的立方时间复杂度限制了它们的可扩展性。为了解决这一挑战,我们…
被动观看培训视频会导致表层学习。加入游戏化可以提升参与度。我们研究软件工程学生以及在...
在安全关键系统工程中采用 large language models 受到可信度、可追溯性以及与既定验证标准的一致性等因素的限制。
传统数据库模糊测试技术主要关注语法正确性和通用SQL结构,忽略了关键但鲜为人知的DBMS特性,例如……
开源软件(OSS)社区历来以英语为主要语言,主导代码、文档和开发者互动……
自主编码代理正日益通过在 GitHub 上提交 pull request 为软件开发做出贡献;然而,人们对这些贡献的了解仍然很少……
iCloud Drive 提供了文件系统接口,但实现的云同步语义在根本上与 POSIX 不同。这种差异并不是 …
表征相似性度量通常要求匹配所有单元,这使它们容易受到神经表征中常见的噪声和离群值的影响。我们……