Source

arXiv

4654 posts from this source

排序:

2个月前 · software · - · -

[Paper] 量子软件可分析性模型的验证：一系列实验

混合软件的可分析性——该软件集成了经典和量子组件——是确保其可维护性和工业采用的关键因素。

#research #paper #software
2个月前 · ai · - · -

[论文] MIP Candy：用于医学图像处理的模块化 PyTorch 框架

医学图像处理需要专门的软件来处理高维体积数据、异构文件格式以及领域特定的训练……

#research #paper #ai #machine-learning #computer-vision
2个月前 · devops · - · -

[Paper] LOCAL 算法是否可计算？

对“标准”LOCAL模型的常见定义往往在一点上显得马虎甚至自相矛盾：节点是否使用任意的 … 来更新它们的状态。

#research #paper #devops
2个月前 · ai · - · -

[Paper] 面向 Agentic 注入的软件生态系统

要充分利用 AI agents 在软件开发中的能力，需要重新思考软件生态系统本身。为此，本文概述了 …

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] Airavat：用于互联网测量的 Agentic 框架

互联网测量面临双重挑战：复杂的分析需要专家级的工具编排，然而即使是语法上正确的实现也可能会…

#research #paper #ai #machine-learning
2个月前 · software · - · -

[Paper] 未见代码库领域的数据合成与基于代码图的训练

在新发布的软件框架的背景下，大型语言模型（LLMs）往往表现不佳，并且出现高比例的 hallucination，因为它们是 n...

#research #paper #software
2个月前 · software · - · -

[Paper] PackMonitor：通过解码时监控实现零 Package Hallucinations

随着大型语言模型（LLMs）日益融入软件开发工作流，它们的可信度已成为一个关键问题。然而，i...

#research #paper #software
2个月前 · devops · - · -

[Paper] Lagom：释放通信与计算重叠的力量，用于分布式 LLM 训练

在分布式大模型训练中，将通信与计算重叠至关重要，但对其进行优化——尤其是当计算成为瓶颈时——仍然是一个挑战。

#research #paper #devops
2个月前 · software · - · -

[Paper] 基于LLM的场景生成流水线，使用扩展的 Scenic DSL 进行自动驾驶安全验证

真实世界的碰撞报告，结合文本摘要和草图，对于自动驾驶系统（ADS）的基于场景的测试非常有价值。然而，cu...

#research #paper #software
2个月前 · devops · - · -

[Paper] 任务调度有效性的粒度特征化

Task-based runtime systems 为并行科学应用提供灵活的负载均衡和可移植性，但它们的强扩展性对……高度敏感。

#research #paper #devops
2个月前 · ai · - · -

[Paper] 用于高效联邦学习的异构感知客户端选择方法论

Federated Learning（FL）实现了一种分布式的客户端‑服务器架构，多个客户端在该架构下协同训练全局机器学习（ML）模型，而无需共享原始数据。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] Mobile-O：移动设备上的统一多模态理解与生成

统一的多模态模型能够在单一架构中同时理解和生成视觉内容。然而，现有模型仍然对数据需求量大，且过于……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] tttLRM：测试时训练用于长上下文和自回归3D重建

我们提出 tttLRM，这是一种新颖的大规模 3D 重建模型，利用 Test-Time Training (TTT) 层实现长上下文、自回归的 3D 重建……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] Flow3r：分解流预测用于可扩展的视觉几何学习

当前的前馈 3D/4D 重建系统依赖于 dense geometry 和 pose supervision —— 在大规模下获取成本高昂，且在动态场景中尤为稀缺……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] Skill-Inject：衡量智能体对 Skill 文件攻击的脆弱性

LLM 代理正快速演进，得益于代码执行、工具以及最近推出的 agent skills 功能。Skills 允许用户扩展 LLM 应用程序……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] JUCAL：在分类任务中联合校准Aleatoric和Epistemic不确定性

我们研究已训练分类器集合的后校准不确定性。具体而言，我们同时考虑 aleatoric（标签噪声）和 epistemic（模型）不确定性。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 仿真就绪的杂乱场景估计：基于物理感知的形状与姿态联合优化

从真实世界观测中估计可用于仿真的场景对于下游的规划和策略学习任务至关重要。遗憾的是，现有方法stru...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 循环结构策略梯度用于部分可观测均值场博弈

Mean Field Games (MFGs) 为建模大规模人口模型中的交互提供了原则性的框架：在大规模下，人口动态变为确定性，……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 大型语言模型能理解数据可视化规则吗？

数据可视化规则——源自数十年在设计和感知方面的研究——确保图表传达的可信度。虽然先前的研究已经表明，大...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] KNIGHT：基于知识图谱的多项选择题生成与自适应难度校准

随着大型语言模型（LLMs）的兴起，它们已在检索增强生成（RAG）等应用中发挥了关键作用。然而，对这些……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 在对抗性数据和用户欺骗下的流行病学动态建模

流行病学模型日益依赖自我报告的行为数据，例如疫苗接种状态、口罩使用和社交距离遵守情况，以预测……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

LAD：学习优势分布用于推理

当前针对大模型推理的强化学习目标主要侧重于最大化期望奖励。该范式可能导致对 dom... 的过拟合。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 是否推理：医学问答中的选择性 Chain-of-Thought

目标：通过避免不必要的推理，同时保持……，提升使用大型语言模型（LLMs）进行医学问答（MedQA）的效率。

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

【论文】NanoKnow：如何了解你的语言模型知道什么

大型语言模型（LLMs）是如何知道它们所知道的内容的？要回答这个问题一直很困难，因为预训练数据往往是一个“黑箱”——未知的……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[论文] NovaPlan：Zero-Shot 长时程操作通过闭环视频语言规划

解决长期任务需要机器人将高层语义推理与低层物理交互相结合。虽然视觉语言模型（VLMs）...

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] ReSyn：用于推理模型的自主扩展合成环境

Reinforcement learning with verifiable rewards (RLVR) 已成为一种有前景的方法，通过利用监督… 来训练推理语言模型 (RLMs)。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 对抗注入下的可靠弃权：紧下界与新上界

我们研究由[Goel et al. 2017]提出的对抗注入模型中的在线学习，其中标记样本流主要是独立同分布（i.i.d.）抽取的 f...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 超越注释瓶颈：AI驱动的生物学与医学发现

对专家注释的依赖长期以来一直是人工智能在生物医学应用中的主要瓶颈。虽然 supe...

#research #paper #ai #machine-learning #computer-vision
2个月前 · devops · - · -

[Paper] 在基于预量化的科学数据压缩器中通过量化感知插值减轻伪影

误差有界的有损压缩被视为应对当今高性能计算中日益增长的科学数据量的有前景的方法……

#research #paper #devops
2个月前 · ai · - · -

[Paper] 检索到的上下文如何塑造 RAG 中的内部表征

检索增强生成（RAG）通过在生成时条件化检索到的外部文档来提升大语言模型（LLMs），但检索的效果……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] StructXLIP：通过多模态结构线索提升视觉-语言模型

基于边缘的表征是视觉理解的基本线索，这一原则源于早期的视觉研究，至今仍然是核心。我们扩展了这一…

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 多语言大型语言模型并未以相同程度理解所有自然语言

大型语言模型（LLMs）在人类获取信息的方式中发挥着关键作用。虽然它们的核心用途依赖于理解书面请求，但我们对……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 大语言模型中的熵

在本研究中，大型语言模型（LLM）的输出被视为一种信息源，生成从有限字母表中抽取的无限符号序列……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] CodeCompass：在代理式代码智能中的导航悖论探索

现代代码智能代理在超过 100 万标记的上下文中运行——远远超出人类手动定位相关文件的规模。然而，代理仍然……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 立场：General Alignment 已到达上限；Edge Alignment 必须认真对待

大型语言模型正在被部署在复杂的 socio-technical 系统中，这暴露了当前 alignment 实践的局限性。我们持有的立场是 d...

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] LLM 驱动的应用需要系统级威胁监控

LLM 驱动的应用正通过将 large language models 作为复杂任务执行的核心推理组件，迅速重塑软件生态系统。Th...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] MAS-FIRE：故障注入与基于LLM的多智能体系统可靠性评估

随着基于 LLM 的多智能体系统（MAS）日益被部署用于复杂任务，确保其可靠性已成为一个紧迫的挑战。由于 MAS 协...

#research #paper #ai #machine-learning
2个月前 · devops · - · -

线性水库：基于对角化的优化

我们引入了一种基于对角化的 Linear Echo State Networks (ESNs) 优化方法，能够降低储层状态每一步的计算复杂度……

#research #paper #devops #computer-vision
2个月前 · ai · - · -

[Paper] 使用 $β$-VAE 在 NSL-KDD 上的无监督异常检测：基于 Latent Space 与 Reconstruction Error 的方法

随着运营技术日益与信息技术融合，对入侵检测系统的需求变得更加重要。本文探讨……

#research #paper #ai #machine-learning
2个月前 · software · - · -

[Paper] Git Takes Two：针对 Git 中分布式工作流的协作学习的 Split-View 感知

Git 被广泛用于协作软件开发，但对新手来说可能具有挑战性。虽然大多数学习工具侧重于个人工作流，Git……

#research #paper #software
2个月前 · devops · - · -

[Paper] GPU 常驻 Gaussian Process Regression 利用 HPX 异步任务

Gaussian processes (GPs) 是一种广泛使用的回归工具，但精确求解器的立方时间复杂度限制了它们的可扩展性。为了解决这一挑战，我们…

#research #paper #devops
2个月前 · software · - · -

[Paper] 探索在软件工程培训中结合视频与Gamification的观点

被动观看培训视频会导致表层学习。加入游戏化可以提升参与度。我们研究软件工程学生以及在...

#research #paper #software
2个月前 · ai · - · -

[Paper] 工作流层面的可信GenAI设计原则在汽车系统工程

在安全关键系统工程中采用 large language models 受到可信度、可追溯性以及与既定验证标准的一致性等因素的限制。

#research #paper #ai #machine-learning
2个月前 · software · - · -

[Paper] FuzzySQL：利用LLM驱动的模糊测试揭示DBMS特性中的隐藏漏洞

传统数据库模糊测试技术主要关注语法正确性和通用SQL结构，忽略了关键但鲜为人知的DBMS特性，例如……

#research #paper #software
2个月前 · software · - · -

[Paper] “用英文写，没人能懂你的语言”：开源仓库中的非英语趋势研究

开源软件（OSS）社区历来以英语为主要语言，主导代码、文档和开发者互动……

#research #paper #software
2个月前 · ai · - · -

[Paper] 当 AI 队友遇到代码审查：协作信号塑造 Agent 编写的 Pull Requests 的整合

自主编码代理正日益通过在 GitHub 上提交 pull request 为软件开发做出贡献；然而，人们对这些贡献的了解仍然很少……

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[Paper] 为什么 iCloud 失败：云同步的范畴错误

iCloud Drive 提供了文件系统接口，但实现的云同步语义在根本上与 POSIX 不同。这种差异并不是 …

#research #paper #devops
2个月前 · ai · - · -

[论文] 部分软匹配距离用于具有部分单元对应的神经表征比较

表征相似性度量通常要求匹配所有单元，这使它们容易受到神经表征中常见的噪声和离群值的影响。我们……

#research #paper #ai #machine-learning

Newer posts

Older posts