Source

arXiv

4750 posts from this source

排序:

4个月前 · ai · - · -

[Paper] 提升 Ray Search Optimization 的收敛率，以实现查询高效的硬标签攻击

在硬标签黑箱对抗攻击中，仅能访问 top-1 预测标签，巨大的查询复杂度对实际应用构成了主要障碍。

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] 评估大型语言模型对软件安全的理解

大型语言模型（LLMs）在软件开发中的使用日益增多，但它们在软件安全方面的专业水平仍不明确。本工作系统地……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 施展 SPELL：句子配对探索以突破 LLM 限制

大型语言模型（LLMs）通过 AI 辅助编码工具彻底改变了软件开发，使得编程经验有限的开发者能够……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] SpidR-Adapt：用于少样本适应的通用语音表示模型

人类婴儿仅通过几百小时的语言输入，就能掌握新语言的基本单元，这凸显了与 da... 相比的显著效率差距。

#research #paper #ai #machine-learning #nlp
4个月前 · devops · - · -

[Paper] 声明式分布式广播使用三值模态逻辑和半拓扑

我们展示了如何在模态逻辑中将分布式算法形式化为声明式公理理论。我们在一个简单的投票协议上演示了该方法。

#research #paper #devops
4个月前 · ai · - · -

[Paper] ClarifyMT-Bench：对话大型语言模型的多轮澄清基准测试与改进

大型语言模型（LLMs）正日益被部署为开放域、多轮对话环境中的对话助理，用户常常提供不完整或……

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] 超越上下文：大型语言模型未能把握用户意图

当前大型语言模型（LLMs）安全方法侧重于显式有害内容，却忽视了一个关键漏洞：无法理解……

#research #paper #ai #machine-learning #nlp
4个月前 · ai · - · -

[论文] zkFL-Health：区块链支持的零知识联邦学习用于医疗 AI 隐私

医疗AI需要大规模、多样化的数据集，但严格的隐私和治理约束阻止了机构之间共享原始数据。联邦学习 (FL)…

#research #paper #ai #machine-learning
4个月前 · software · - · -

[论文] 人工还是仅仅巧妙？LLMs 在编程中会弯曲规则吗？

大型语言模型（LLMs）被广泛用于自动代码生成，然而它们表面的成功常常掩盖了预训练目标与实际应用之间的张力。

#research #paper #software
4个月前 · devops · - · -

[Paper] ESCHER：高效且可扩展的超图演化表示及其在三元计数中的应用

在大型复杂网络中，超出成对关系的高阶交互通常被建模为 hypergraph。分析 hypergraph 的属性，例如三元……

#research #paper #devops
4个月前 · ai · - · -

[Paper] Mesh-Attention：一种通信高效、提升数据局部性的分布式注意力

分布式注意力是扩展大型语言模型（LLMs）上下文窗口的根本问题。当前最先进的方法 Ring-Attention 存在……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 考虑截止期限的在线调度用于LLM微调的现货市场预测

随着基础模型规模的增长，对其进行微调的成本也越来越高。虽然 GPU 现货实例提供了一种低成本的替代方案，相比按需资源……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 一把工具足够：强化学习用于仓库级 LLM 代理

在大型开源软件（OSS）代码库中定位需要修改的文件和函数是具有挑战性的，因为它们的规模和结构复杂性……

#research #paper #ai #machine-learning
4个月前 · devops · - · -

[Paper] 深入探讨 3D 并行与异构 Spot 实例 GPU：设计与影响

大型语言模型（LLMs）的快速增长以及新GPU产品的持续发布，显著提升了对分布式训练的需求……

#research #paper #devops
4个月前 · ai · - · -

[Paper] AirGS：实时 4D 高斯流媒体用于自由视点视频体验

Free‑viewpoint video（FVV）通过允许用户从任意视角观看场景，实现沉浸式观看体验。作为一种重要的重建技术……

#research #paper #ai #machine-learning
4个月前 · devops · - · -

[Paper] 随机良构转移系统

在将概率调度规则引入 well-structured transition systems 的基础上，我们定义了一类新的 stochastic well-structured transition systems……

#research #paper #devops
4个月前 · devops · - · -

[Paper] RHAPSODY：大规模执行混合 AI‑HPC 工作流

混合 AI‑HPC 工作流将大规模仿真、训练、高通量推理以及紧耦合的、基于代理的控制整合在一次执行中……

#research #paper #devops
4个月前 · ai · - · -

[Paper] FEM-Bench：用于评估代码生成型大语言模型的结构化科学推理基准

随着LLMs在物理世界推理能力方面的进步，缺乏严格的基准来评估它们生成科学上…

#research #paper #ai #machine-learning
4个月前 · devops · - · -

[Paper] SoK: 快速安全的最终性

虽然以太坊已经成功实现了动态可用性和安全性，但在交易执行与不可变的最终性之间仍然存在根本性的延迟。

#research #paper #devops
4个月前 · ai · - · -

[Paper] SemanticGen: 语义空间中的视频生成

最先进的视频生成模型通常在 VAE 空间中学习视频潜在变量的分布，并使用 VAE 解码器将其映射到像素。虽然 th...

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] LongVideoAgent：多智能体推理与长视频

最近在多模态 LLM 和使用工具进行长视频 QA 的系统方面的进展，表明了对长达数小时情节进行推理的前景。然而，许多方法...

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] SpatialTree：空间能力在 MLLMs 中的分支

认知科学表明，空间能力是逐步发展的——从感知到推理再到交互。然而在多模态大语言模型（MLLMs）中，这种层次...

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 视频化身中的主动智能 via Closed-loop World Modeling

当前的视频化身生成方法在身份保持和动作对齐方面表现出色，但缺乏真实的自主性，它们无法自主追求长期目标。

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 让大语言模型成为高效稠密检索器

最近的研究表明，直接微调大型语言模型（LLMs）用于密集检索可以获得强大的性能，但它们庞大的参数数量……

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] FedPOD：用于联邦学习的可部署训练单元

本文提出了 FedPOD（Proportionally Orchestrated Derivative），用于在多方联邦学习中优化学习效率和通信成本。

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] Saddle-to-Saddle 动力学解释了跨神经网络架构的简洁偏差

使用梯度下降训练的神经网络通常会随时间学习到日益复杂的解，这一现象被称为 simplicity bias。尽管被 wid…

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 重新利用 Video Diffusion Transformers 实现鲁棒点跟踪

点跟踪旨在定位视频帧之间的对应点，作为四维重建、机器人技术和视频编辑的基础任务。现有...

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 自回归模型中的涌现时间抽象实现层次强化学习

大规模自回归模型在下一标记预测上进行预训练，并通过强化学习（RL）进行微调，已在许多方面取得了前所未有的成功……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] MoE-DiffuSeq：使用 Sparse Attention 和 Mixture of Experts 提升长文档 Diffusion Models

我们提出 MoE-DiffuSeq，这是一种基于 mixture of experts 的框架，用于增强 diffusion 模型在长文档生成中的能力。现有的基于 diffusion 的文本生成…

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] Cube Bench：MLLMs空间视觉推理基准

我们引入了 Cube Bench，一个用于评估多模态大语言模型（MLLMs）在空间和序列推理方面的 Rubik's‑cube 基准。该基准...

#research #paper #ai #machine-learning #nlp #computer-vision
4个月前 · ai · - · -

[Paper] 利用高保真数字模型和强化学习进行任务工程：完美信息下的空中灭火案例研究

随着系统工程（SE）目标从单体系统的设计与运行演变为复杂的系统群（SoS），任务工程学的学科……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 自动化立体定向放射外科计划使用人机交互推理的大型语言模型代理

立体定向放射外科 (SRS) 需要在关键结构周围进行精确的剂量塑形，但由于黑箱 AI 系统的不透明性，其临床采纳受到限制……

#research #paper #ai #machine-learning #nlp
4个月前 · ai · - · -

【论文】Relu 和 softplus 神经网络作为零和回合制游戏

我们证明，ReLU 神经网络的输出可以解释为一个零和、回合制、停止游戏的价值，我们称之为 ReLU net game。 The ...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] LLMs 能预测自己的失败吗？通过内部电路实现自我意识

大型语言模型（LLMs）生成流畅且复杂的输出，但往往无法识别自己的错误和幻觉。现有方法通常……

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] 使用 Gold-Standard 质量指标改进 ML 训练数据

手工标记的训练数据对许多机器学习任务至关重要。然而，训练数据质量控制在文献中受到的关注很少，d...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] Performative Policy Gradient：可执行强化学习中的最优性

部署后的机器学习算法常常会影响它们所作用的环境，从而改变标准强化学习所依赖的底层动态……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 快速失败，赢取巨大成功：重新思考 Speculative Decoding 中的 Drafting 策略 via Diffusion LLMs

Diffusion Large Language Models (dLLMs) 提供快速的并行 token 生成，但其单独使用受到固有的效率‑质量权衡的困扰。W...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 通过 KL 引导层选择对混合注意力模型进行蒸馏

将预训练的 softmax attention Transformers 蒸馏为更高效的混合架构，在其中交替使用 softmax 和 linear attention 层，是一种有前景的……

#research #paper #ai #machine-learning #nlp
4个月前 · ai · - · -

[Paper] LEAD：最小化学习者-专家不对称的端到端驾驶

Simulators 可以生成几乎无限的驾驶数据，但在仿真中，imitation learning policies 仍然难以实现稳健的 closed-loop performance……

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] 浅层神经网络通过可学习的通道注意力学习低阶球面多项式

我们研究在 ℝ^d 的单位球面上学习一个低阶球面多项式（次数 ℓ₀ = Θ(1) ≥ 1）的问题，通过训练一个过参数化的模型来实现。

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] FlashVLM：文本引导的视觉令牌选择用于大型多模态模型

大型视觉语言模型（VLM）通常在每张图像或视频帧上处理数百甚至数千个视觉 token，导致二次注意力成本和 su...

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 在4D中学习推理：用于视觉语言模型的动态空间理解

视觉语言模型（VLM）在通用理解方面表现出色，但在动态空间推理（DSR）方面仍然薄弱，即对对象 g... 的演变进行推理。

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[论文] 推进多模态教师情感分析：大规模 T-MED 数据集与有效的 AAM-TSA 模型

教师的情绪状态在教育情境中至关重要，对教学效能、学生参与度和学习成就产生深远影响。然而……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] Step-DeepResearch 技术报告

随着大型语言模型（LLMs）向自主代理转变，Deep Research 已成为一个关键指标。然而，现有的学术基准如 BrowseComp 往往未能满足 …

#research #paper #ai #nlp
4个月前 · devops · - · -

[Paper] WOC：双路径加权对象共识的高效实现

现代分布式系统面临一个关键挑战：现有的共识协议要么针对节点异构性进行优化，要么针对工作负载独立性进行优化，但两者无法兼顾……

#research #paper #devops
4个月前 · ai · - · -

[Paper] SweRank+: 多语言、多轮代码排序用于软件问题定位

维护大规模、多语言的 codebases 关键在于准确定位问题，这需要将自然语言错误描述映射到相关的……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 大脑中的相干性在可分离的时间尺度上展开

语言的连贯性要求大脑满足两种相互竞争的时间需求：在扩展语境中逐渐累积意义，以及快速重新配置……

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] 使用衍射解码器的快照3D图像投影

3D图像显示对于下一代体积成像至关重要；然而，密集深度复用用于3D图像投影仍然具有挑战性，因为diff…

#research #paper #ai #computer-vision

Newer posts

Older posts