Source

arXiv

4654 posts from this source

排序:

1个月前 · ai · - · -

[Paper] 联邦层次聚类与自动选择最佳聚类数

联邦聚类（Federated Clustering，FC）是一种新兴且有前景的解决方案，用于在分布式且受隐私保护的数据中探索数据分布模式，属于无监督学习。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] Feynman：知识注入的 Diagramming Agent 用于可扩展视觉设计

视觉设计是最先进的多模态 AI 系统的重要应用。提升这些系统需要大规模高质量的视觉‑语言数据……

#research #paper #ai #machine-learning
1个月前 · software · - · -

[Paper] 集中式 FLOSS 开发中的语言相似性

当自由/开源软件（FLOSS）管理者集中项目开发时，他们可能会削弱项目的可持续性，并影响…

#research #paper #software
1个月前 · devops · - · -

[论文] 从关系型数据库进行大规模金融交易导出的流式 REST API

金融平台和企业系统经常提供交易导出功能，以支持报告、对账、审计和监管合规。

#research #paper #devops
1个月前 · ai · - · -

[Paper] TaxBreak: 通过开销分解揭示LLM推理的隐藏成本

大型语言模型（LLM）推理被广泛用于交互式助手和代理系统。在对延迟敏感的部署中，推理时间可能会变得……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] KernelFoundry：硬件感知的进化式 GPU kernel 优化

优化 GPU kernel 对大型语言模型（LLMs）来说，比标准代码生成任务要困难得多，因为它需要理解……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 剪枝诱导的全连接神经网络阶段：eumentia、dementia 和 amentia

现代神经网络参数过多，剪枝通过去除冗余的神经元或连接，已成为压缩的关键方法……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] EVATok：自适应长度视频标记化用于高效视觉自回归生成

自回归（AR）视频生成模型依赖于将像素压缩为离散 token 序列的视频 tokenizer。这些 token 序列的长度是 …

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] MM-CondChain：程序化验证的视觉基础深度组合推理基准

多模态大型语言模型（MLLMs）正日益用于执行视觉工作流，例如在 GUI 中进行导航，其中下一步取决于已验证的视觉……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] OmniStream：在连续流中掌握感知、重建和动作

现代视觉代理需要具备通用的、因果的、以及物理结构化的表征，以在实时流媒体环境中运行。然而，当前…

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] GRADE：对图像编辑中学科驱动推理的基准测试

Unified multimodal models 旨在实现联合理解、推理和生成，但当前的 image editing benchmarks 主要局限于自然图像和……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 视频流思考：VideoLLMs 可同时观看和思考

在线视频大语言模型（VideoLLMs）在支持响应式、实时交互方面发挥关键作用。现有方法侧重于流式感知……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 潜在颜色子空间：高维混沌中的涌现秩序

文本到图像生成模型发展迅速，但实现对生成图像的细粒度控制仍然困难，主要是由于对...的有限了解。

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] Spatial‑TTT: 基于流式视觉的空间智能与测试时训练

人类通过一连串的视觉观察来感知和理解现实世界的空间。因此，能够流式地维护和更新空间证据的能力……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] DVD：确定性视频深度估计与生成先验

现有的视频深度估计面临一个根本性的权衡：生成模型会出现随机的几何幻觉和尺度漂移，而判别模型……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] SciMDR：基准测试与推进科学多模态文档推理

构建用于基础模型训练的科学多模态文档推理数据集涉及规模、忠实性和现实性之间的固有权衡。

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai · - · -

[Paper] 匹配特征而非标记：基于能量的语言模型微调

交叉熵（CE）训练为语言模型提供了密集且可扩展的监督，但它在教师强制（teacher forcing）下优化下一个标记的预测，而不是……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 检视非可验证 LLM 后训练中作为评审的推理 LLM

推理 LLMs-as-Judges，能够受益于推理时的规模扩展，为将推理模型的成功扩展到非可验证的领域提供了有前景的路径。

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 可分离神经架构作为统一预测与生成智能的原语

跨越物理、语言和感知的智能系统通常表现出 factorisable structure，但通常被建模为 monolithic neural architectures …

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] STAMP：选择性任务感知机制用于文本隐私

我们提出了 STAMP（Selective Task-Aware Mechanism for Text Privacy），一个用于任务感知文本隐私化的新框架，能够实现改进的隐私‑效用 …

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 基于学习冲突的增量神经网络验证

Neural network verification 通常用作更大分析过程的核心组件，这些过程会生成一系列紧密相关的 verification queries。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 用于潜在规划的时间直化

学习良好的表征对于使用世界模型进行潜在规划至关重要。虽然预训练的视觉编码器能够生成强大的语义视觉特征，但它们……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 人工智能代理的安全考虑

本文是对 Perplexity 对 NIST/CAISI Request for Information 2025-0035 的回复进行轻度改编的版本，详细阐述了我们的观察和建议 c...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] Neural Thickets: 多样任务专家在预训练权重周围密集分布

预训练产生的学习 parameter vector 通常被视为进一步 iterative adaptation 的起点。在本工作中，我们则将其视为……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 通过 LLM 驱动的跨学科灵感点燃科学创造力

尽管跨学科研究能够带来更大和更长期的影响，但大多数工作仍局限于单一领域的学术孤岛。最近的基于AI的……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 基于CEGAR的对象装配与调度的求解策略组合用于顺序3D打印

几十年前只有超级计算机才拥有的计算能力，尤其是它们的并行性，如今已经在标准个人电脑上可用。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] RDNet：面向区域比例感知的动态自适应光学遥感图像显著目标检测网络

在遥感图像中，显著目标检测（Salient object detection, SOD）面临着显著的挑战，主要由于目标尺寸变化幅度大，以及自注意力（self‑att）的计算成本……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] WORKSWORLD：用于分布式流水线工作流的综合数值规划与调度领域

本研究致力于分布式数据管道（或工作流）的自动化规划与调度。我们开发了一种通用的工作流和资源图表示方法……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] IndexCache：通过跨层索引复用加速稀疏注意力

长上下文的 agentic 工作流已成为大型语言模型的关键使用场景，使得注意力效率对推理速度和……至关重要。

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 长上下文编码器模型用于波兰语理解

虽然 decoder-only 大型语言模型（LLMs）最近在 NLP 领域占据主导地位，但 encoder-only 架构仍然是一种成本效益高且参数高效的……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 战略导航还是随机搜索？代理和人类如何在文档集合上推理

多模态代理提供了一条有前景的路径，用于自动化复杂的文档密集型工作流。然而，一个关键问题仍然存在：这些代理是否展示出通用性……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] QAQ：双向语义连贯性用于选择高质量合成代码指令

Synthetic data 已成为训练 code generation models 的关键，但它会引入大量噪声和幻觉，这些问题难以检测……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] LifeSim：长时程用户生活模拟器用于个性化助手评估

大型语言模型（LLMs）的快速发展加速了通用 AI 助手的进程。然而，现有的用于个性化助手的基准……

#research #paper #ai #nlp
1个月前 · devops · - · -

[Paper] HPC容器用于EBRAINS：迈向可移植的跨领域软件环境

在不同的 HPC 站点上部署复杂的分布式科学工作流常常受到站点特定依赖和复杂构建环境的阻碍。Thi...

#research #paper #devops
1个月前 · ai · - · -

[Paper] 拓扑 DeepONets 与 Chen‑Chen 操作符近似定理的推广

Deep Operator Networks（DeepONets）提供了一种 branch‑trunk 神经网络结构，用于近似在函数空间之间作用的非线性算子。在该类…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] SNAP-V：一种具备可配置神经形态加速的 RISC-V SoC，用于小规模脉冲神经网络

Spiking Neural Networks（SNNs）因其低功耗和计算效率在边缘计算中受到显著关注。然而，现有…

#research #paper #ai
1个月前 · software · - · -

[Paper] QUARE：需求工程中质量属性平衡的多代理协商

需求工程（Requirements engineering，RE）对软件成功至关重要，但其自动化仍具挑战性，因为必须考虑多个经常相互冲突的质量属性……

#research #paper #software
1个月前 · ai · - · -

[Paper] 社会、法律、伦理、共情和文化规范的操作化用于 AI 代理

随着 AI agents 在医疗保健和执法等高风险领域的使用日益增多，使它们的行为与社会、法律、伦理、同理心等保持一致……

#research #paper #ai #machine-learning
1个月前 · software · - · -

[Paper] 提升需求可追溯链接恢复：一种基于 T‑SimCSE 的新方法

需求可追溯性在确保软件质量和应对需求变更方面发挥着重要作用。需求追踪链接（例如…）

#research #paper #software
1个月前 · devops · - · -

[Paper] Carnot Bound：带宽高效共识的限制与可能性

在基于领导者的状态机复制（SMR）协议中，领导者的出站带宽是天然的吞吐瓶颈。纠删码可以缓解……

#research #paper #devops
1个月前 · ai · - · -

[Paper] 稳定脉冲：通过位与运算实现双一致性优化的脉冲神经网络

尽管脉冲神经网络（SNNs）的时间脉冲动力学能够实现低功耗的时间模式捕获能力，但它们也会带来固有的不一致……

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] Subtime：可逆信息交换与经典时间的出现

我们形式化了 subtime 的概念——一种在纠缠系统内部进行可逆信息交换的模式——并展示了经典时间如何作为一种渐近……

#research #paper #devops
1个月前 · ai · - · -

[论文] 基于量子化的优化的量子力学框架：从梯度流到薛定谔方程

本工作提出了一个量子力学框架，用于分析基于量化的优化算法。基于量化的搜索的采样过程……

#research #paper #ai
1个月前 · devops · - · -

[Paper] NCCLbpf：经验证的、可组合的策略执行用于GPU集体通信

NCCL 是大规模分布式训练中集体 GPU 通信的事实标准，严重依赖插件来自定义运行时行为。Ho...

#research #paper #devops
1个月前 · ai · - · -

【论文】使用 iSWE Agent 解决 Java 代码仓库问题

在代码仓库中解决问题是软件工程的重要组成部分。各种近期系统使用大型语言模型自动解决问题。

#research #paper #ai #machine-learning
1个月前 · software · - · -

[论文] 合成闭环评估 LLMs 在 RTL 生成中的质量、可靠性与失效模式

RTL 生成的要求不仅仅是软件代码合成：设计必须在语法上有效、可综合、功能正确且硬件高效。Exis...

#research #paper #software
1个月前 · software · - · -

[Paper] 揭示 Patch Overfitting Detection Techniques 的实际不足

自动化程序修复（APR）可以减少开发人员用于调试的时间，使他们能够专注于软件开发的其他方面。自动生成……

#research #paper #software
1个月前 · software · - · -

[Paper] ExecVerify：白盒强化学习与可验证的逐步奖励用于代码执行推理

Code LLMs 仍然在代码执行推理方面表现不佳，尤其是在较小的模型中。现有方法依赖于使用教师生成的监督微调（supervised fine-tuning，SFT）……

#research #paper #software

Newer posts

Older posts