Source

arXiv

4592 posts from this source

排序:

1周前 · ai · - · -

[Paper] ReCap：轻量化指涉式 Grounding 用于连贯故事可视化

Story Visualization 旨在生成一系列图像，忠实地描绘文本叙事，保持角色身份、空间配置、...

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 何时 LLMs 能在弱监督下学习推理？

大型语言模型通过强化学习与可验证奖励（RLVR）实现了显著的推理改进。然而，随着模型能力的...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] T-REN：学习文本对齐的区域标记提升稠密视觉语言对齐与可扩展性

尽管最近取得了进展，vision-language encoders 仍面临两个核心限制：(1) 语言与 dense vision features 之间的对齐较弱，这会导致……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 重新审视主动序列预测驱动的均值估计

在本工作中，我们重新审视了主动序列预测驱动的均值估计问题，其中在每一轮都必须决定 g 的查询概率……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[论文] 潜在相位移回滚：通过残差流监控和 KV-Cache 引导进行推理时错误校正

大型语言模型在生成过程中经常会出现不可恢复的推理错误：一旦出现错误的步骤，后续的 token 会进一步加剧错误……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] MultiWorld: 可扩展的多智能体多视角视频世界模型

Video world models 在模拟用户或代理的动作所导致的环境动态方面取得了显著成功。它们被建模为动作‑…

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 双重对齐：语言模型层与人类句子处理

最近的一项研究（Kuribayashi 等，2025）显示，人类的句子处理行为，通常在句法上不具挑战性的结构上进行测量，ca…

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] SynAgent：通过单体到协作代理协同实现可泛化的协作式类人操作

可控协作类人操作是具身智能的一个基础且具有挑战性的问题，因为数据极度稀缺，复杂性在……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] GSQ：通过 Gumbel-Softmax 采样实现对 LLM 的高精度低精度标量量化

权重量化已成为高效 LLM 部署的标准工具，尤其是在本地推理中，模型现在常规以 2-3 位的精度进行服务，p...

#research #paper #ai #machine-learning #nlp
1周前 · software · - · -

[Paper] 隐私政策与日志匹配吗？对 Android 应用日志中隐私披露的实证研究

隐私政策旨在向用户说明软件系统如何收集和处理数据，但它们往往仍然模糊或不完整。本文提出...

#research #paper #software
1周前 · ai · - · -

FUSE：在零标注数据下集成验证器

对模型输出的验证正迅速成为大语言模型（LLMs）在训练和实际部署中的关键原语。实际上，t...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] ClawEnvKit：用于爪形智能体的自动环境生成

构建用于训练和评估爪状代理的环境仍然是一个手工、耗费人力的过程，难以规模化。我们认为，需要……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 转移矩阵正则化用于咨询对话中的下一个对话行为预测

本文研究了如何将经验性的对话流统计信息纳入下一对话行为预测（NDAP）。提出了一种 KL 正则化项，...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] MetaCloak-JPEG：JPEG 鲁棒对抗扰动，防止未授权的 DreamBooth 基于 Deepfake 生成

主题驱动的文本到图像合成的快速进展，尤其是 DreamBooth，使得一个无需同意的深度伪造流水线成为可能：对手只需要…

#research #paper #ai #computer-vision
1周前 · devops · - · -

[Paper] HybridGen：通过 CPU‑GPU 混合计算实现高效 LLM 生成推理

随着现代 LLM 支持数千到数百万个 token，KV 缓存会增长到数百 GB，给内存容量和带宽带来压力。现有的解决方案，...

#research #paper #devops
1周前 · software · - · -

[Paper] 朝着更好的静态代码分析报告：基于 Sentence Transformer 的不可操作警报过滤

静态代码分析（SCA）工具被广泛用作检测软件系统中错误和漏洞的有效手段。然而，由……生成的报告...

#research #paper #software
1周前 · ai · - · -

[Paper] UDM-GRPO：稳定且高效的组相对策略优化用于统一离散扩散模型

Uniform Discrete Diffusion Model（UDM）最近作为一种有前景的离散生成建模范式出现；然而，它与强化学习的结合……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 有害顺从的不同路径：行为副作用与跨 LLM 破解的机制分歧

Open-weight language models 可以通过多种不同的干预方式变得不安全，但 resulting models 在能力上可能有显著差异，be...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] MASS-RAG：多代理合成检索增强生成

大型语言模型（LLMs）在检索增强生成（RAG）中被广泛使用，以在推理阶段加入外部知识。然而，当检索……

#research #paper #ai #nlp
1周前 · software · - · -

[论文] TypeScript Repository 索引用于 Code Agent 检索

基于图的代码索引可以通过保留调用链和依赖关系来提升针对 LLM‑based code agents 的上下文检索，而关键词搜索……

#research #paper #software
1周前 · software · - · -

[Paper] OpenGame：面向游戏的开放式 Agentic 编码

游戏开发位于创意设计与复杂软件工程的交叉点，需要对游戏引擎、实时…

#research #paper #software
1周前 · ai · - · -

[Paper] 中性演化的相互交织复杂性在困境之巢

Molecular biology 具有众多蛋白质复合体，它们以相互交错的方式协同工作，以实现不同的功能。Adaptive evolution 解释了……

#research #paper #ai
1周前 · software · - · -

[Paper] AI Bots 足迹在 GitHub Actions CI/CD 工作流中的可靠性

持续集成和部署（CI/CD）工作流是现代软件交付的核心，但在这些工作流中运行的自主 AI 机器人的可靠性……

#research #paper #software
1周前 · software · - · -

[Paper] 从程序切片到因果清晰度：通过上下文划分和 LLM-as-a-Judge 评估忠实、可操作的 LLM 生成的失败解释

基于大型语言模型（LLM）的调试系统可以生成故障解释，但这些解释可能不完整或不正确。误导性的解释……

#research #paper #software
1周前 · ai · - · -

[Paper] LeGo-Code：模块化课程学习能推动复杂代码生成吗？来自 Text-to‑SQL 的洞见

最近，面向代码的大型语言模型（LLMs）在将自然语言翻译为可执行代码方面展示了强大的能力。Text-to-SQL 是……

#research #paper #ai #machine-learning
1周前 · software · - · -

[Paper] 面向从非结构化规范进行需求形式化的Agentic LLM方法

安全关键系统的早期规格通常以自然语言表达，这使得难以推导出适用于 ... 的形式化属性。

#research #paper #software
1周前 · ai · - · -

[Paper] WebCompass：面向代码语言模型的多模态 Web 编码评估

大型语言模型正快速演变为能够进行端到端网页编码的交互式编码代理，然而现有的基准仅评估狭窄的切片……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 基于相似性的投资组合构建用于黑盒优化

在黑箱优化中，一个核心问题是针对给定的、之前未见过的问题应该使用哪种算法。然而，选择单一算法却…

#research #paper #ai
1周前 · ai · - · -

[Paper] 支配集合的量度：基于度量几何的Pareto兼容指标

我们研究 magnitude 作为一种新的单值且严格帕累托兼容的质量指标，用于评估多目标优化中有限近似集合对帕累托前沿的逼近。

#research #paper #ai
1周前 · software · - · -

[Paper] Proxics: 用于远程内存加速器的高效编程模型

使用诸如 CXL memory pools 之类的分离式或远程内存系统重新激发了对近数据处理（Near-Data Processing，NDP）的兴趣：将核心置于靠近内存的位置，以 r...

#research #paper #software
1周前 · devops · - · -

[Paper] 用户在弹性键值存储实现中对 MPI RMA 和 ULFM 的体验

随着硬件故障（如节点丢失）变得越来越常见，MPI 程序员可能希望将易受影响的数据保存在弹性存储中。虽然 third-party st...

#research #paper #devops
1周前 · devops · - · -

[Paper] 信任，但要验证：ByzTwin-Range，一个用于拜占庭故障的数字孪生赛博靶场

关键基础设施日益依赖互联且软件驱动的网络物理系统（CPS），使运营过程面临意外……

#research #paper #devops
1周前 · devops · - · -

[Paper] 使用预测建模优化分布式集群中的内存分配

在现代 distributed systems 中，高效的 resource allocation 是保持 scalability、降低 operational costs 并确保 fast execution 的关键方面，即使……

#research #paper #devops
1周前 · devops · - · -

[Paper] 朝向最优性：对直径为二网络中领袖选举的消息复杂度进行更紧致的分析

我们研究直径为二的同步网络中 leader election 的消息复杂度。我们的主要贡献是对随机算法的精细分析……

#research #paper #devops
1周前 · devops · - · -

[Paper] Matrix-Free 3D SIMP 拓扑优化与融合 Gather‑GEMM‑Scatter 核

matrix-free gather-batched-GEMM-scatter 模式消除了三维 SIMP 拓扑优化中的 global stiffness assembly，但传统的 ...

#research #paper #devops
1周前 · ai · - · -

[Paper] 多目标进化算法在组合优化问题上的可扩展性

进化算法的可扩展性是指评估其性能随着问题规模的增加而如何变化。在多目标优化领域，...

#research #paper #ai
1周前 · devops · - · -

[Paper] GPUOS：用于透明操作融合的 GPU 操作系统原语

现代深度学习工作负载通常由许多小的 tensor 操作组成，尤其是在 inference、attention 和 micro‑batched training 中。在这些场景下，...

#research #paper #devops
1周前 · ai · - · -

[Paper] DeInfer：用于分解式大型语言模型的高效并行推理

现有的大语言模型（LLM）分解工作主要关注提升下游任务的性能，但它们忽视了并行推理的不足……

#research #paper #ai #nlp
1周前 · devops · - · -

[Paper] 面向 HPC 的节能协同调度

现代多GPU HPC系统提供了巨大的计算能力，但低效的GPU分配常导致能源浪费和利用率不足。在实践中...

#research #paper #devops
1周前 · ai · - · -

[Paper] 关于遗传编程中符号回归的泛化界限

符号回归（SR）与遗传编程（GP）旨在直接从数据中发现可解释的数学表达式。尽管它在经验上表现强劲……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 单调却激动人心：关于演化高非线性单调布尔函数的研究

单调布尔函数是结构上重要的一类布尔函数，但它们受限的形式对可实现的非线性…

#research #paper #ai
1周前 · ai · - · -

[Paper] VIBE：语音诱导的开放式偏见评估用于大规模音频语言模型的真实世界语音

大型音频语言模型（Large Audio-Language Models，LALMs）正日益融入日常应用，但它们的生成偏差仍未得到充分研究。现有的语音公平…

#research #paper #ai #nlp
1周前 · ai · - · -

[论文] DORA Explorer：在无需训练的情况下提升 LLM 的探索能力

尽管进展迅速，用于序列决策的 LLM（即 LLM 代理）仍然难以产生多样化的输出。这导致了探索不足……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] RemoteShield：实现稳健的多模态大语言模型用于地球观测

一个稳健的用于地球观测的多模态大语言模型（MLLM）应在真实的输入变化下保持一致的解释和推理。...

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 利用画像感知的多模态 LLM 提升零样本个性化图像美学评估

个性化图像美学评估（PIAA）旨在预测单个用户对图像的主观评分，这需要对用户特定的美学……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 基于条纹投影的视觉流水线用于自动硬盘拆解

未回收的 e-waste 代表了巨大的经济损失。硬盘驱动器（HDD）构成了有价值的 e-waste 流，需要机器人拆解。Automa...

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 一种多代理方法用于从表格数据文档进行声明验证

我们提出了一种用于从表格数据文档中进行声明验证的新方法。近期基于 LLM 的方法要么采用复杂的预训练/微调，要么…

#research #paper #ai #nlp
1周前 · ai · - · -

[论文] 区域亲和注意力用于深紫外成像下的全切片乳腺癌分类

乳腺癌诊断需要快速且精确的工具，但传统的组织病理学方法在术中常常不足。Deep Ultraviole...

#research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts