Source

arXiv

4576 posts from this source

排序:

4天前 · ai · - · -

[Paper] 无文字思考：使用抽象 Chain-of-Thought 的高效潜在推理

虽然冗长的、明确的思维链（chains-of-thought，CoT）已被证明在复杂推理任务上有效，但在推理时生成它们成本很高。非语言推理……

#research #paper #ai #nlp
4天前 · ai · - · -

[Paper] 呼吸气流的时间局部化参数分解用于子呼吸分析

呼吸气流信号提供了对呼吸力学的关键洞察，但传统分析方法在表征方面仍然受限……

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] CRAFT：用于训练数据自适应过滤的聚类回归

在大型语料库中选择一个小而高质量的子集用于微调变得越来越重要，因为语料库规模已增长到数千万个数据点，使得 …

#research #paper #ai #machine-learning #nlp
4天前 · ai · - · -

[Paper] SS3D：端到端自监督 3D 来自网络视频

我们提出了 SS3D，一个基于 SfM 的大规模网络自监督预训练流水线，用于从单目视频进行前馈 3D 估计。我们的模型联合预测深度……

#research #paper #ai #computer-vision
4天前 · ai · - · -

[Paper] 供应链依赖如何使 AI 招聘应用中的偏差测量和责任归属变得复杂

在招聘中日益采用 AI 系统引发了对算法偏见和问责制的担忧，促使监管响应，包括欧盟 AI 法案……

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 通过白盒信号子空间探针对图数据集的操作特征指纹

图神经网络在节点分类准确率方面表现出色，但它们学习到的信息传递将 ego attributes、neighborhood smoothing、high-pass 等纠缠在一起。

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 重新思考 XAI 评估：在高风险场景中对 Shapley 基准的以人为本审计

Shapley values 是可解释 AI 的基石，但它们在各种竞争性表述中的激增导致了一个碎片化的局面，几乎没有共识……

#research #paper #ai #machine-learning
4天前 · software · - · -

[Paper] RealBench：仓库级代码生成基准，符合真实世界软件开发实践

编写代码在软件开发中需要大量时间和精力。为了自动化这一过程，研究人员在使用 Large Language Models 方面取得了显著进展。

#research #paper #software
4天前 · ai · - · -

[Paper] PASR：姿态感知 3D 形状检索从遮挡的单视图

单视图 3D 形状检索是一个基础且具有挑战性的任务，随着可用 3D 数据的增长，其重要性日益提升。现有方法...

#research #paper #ai #computer-vision
4天前 · software · - · -

[Paper] 验证器警告并未提升可理解性预测

软件验证的倡导者认为，代码简洁性与验证代码所需的工作量有关，假设形式验证器产生更少的 false…

#research #paper #software
4天前 · ai · - · -

[Paper] 基于结构引导的扩散模型用于EEG视觉认知重建

目标：从脑电图（EEG）解码视觉信息是神经科学和脑机接口（BCI）研究中的重要问题。Ex...

#research #paper #ai #computer-vision
4天前 · ai · - · -

[Paper] 质量驱动的深度学习选择性变异

Mutants 在测试和调试中支持两种角色：(i) 作为测试目标，(ii) 作为真实错误的替代品。难以杀死的 Mutants 能提供更好的指导……

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 重新思考数学推理评估：一种超越符号刚性的稳健 LLM-as-a-Judge 框架

近期在大型语言模型方面的进展显著提升了各类任务的表现，包括用于评估的数学推理。

#research #paper #ai #machine-learning
4天前 · ai · - · -

[Paper] 有用的非鲁棒特征在生物医学图像中无处不在

我们研究深度网络在医学影像中是否学习到有用的 nonrobust features —— 这些是不可被人类解释且高度易感的 predictive input patterns……

#research #paper #ai #machine-learning #computer-vision
4天前 · ai · - · -

[论文] QuantClaw：在关键位置的精度用于 OpenClaw

自主代理系统（如 OpenClaw）由于长上下文输入和多轮推理，引入了显著的效率挑战。这导致了 prohi...

#research #paper #ai #machine-learning #nlp
4天前 · ai · - · -

[Paper] 学习证据高亮用于 Frozen LLMs

大型语言模型（LLMs）能够进行良好的推理，但在长且噪声较多的上下文中，关键证据往往被埋藏，从而被忽略。我们提出了 HiLight，一种 Evidence Emph…

#research #paper #ai #machine-learning #nlp
5天前 · devops · - · -

[Paper] LaissezCloud：持续资源重新协商用于公共云

公共云越来越多地提供异构硬件，但它们的分配接口仍然围绕刚性的 on‑demand 和 spot 服务类别构建。这使得……

#research #paper #devops
5天前 · software · - · -

[Paper] AI 辅助测试生成中的测试设计与评审论证

AI 助手能够日益生成并演化测试用例。挑战不再仅仅是产生它们，而是还要帮助工程师理解为什么 a ge...

#research #paper #software
5天前 · software · - · -

[Paper] 游戏化架构治理以降低微服务系统中的组织耦合

Microservice 是一种流行的软件架构，依赖去中心化的团队和明确的服务所有权来支持模块化和可扩展性。然而，i...

#research #paper #software
5天前 · ai · - · -

[论文] HubRouter：一种可插拔的次二次路由原语，用于混合序列模型

我们引入 HubRouter，一个可插拔模块，用于将 O(n^2) 注意力层替换为 O(nM) 的 hub‑mediated 路由，其中 M << n 是一个很小的学习数量……

#research #paper #ai #machine-learning
5天前 · devops · - · -

[Paper] $O(K)$ 近似 Coflow 调度在 $K$-Core 光学电路交换网络

Coflow 已成为分布式系统中一种基本的应用层抽象，表示通信依赖并实现协作式 man...

#research #paper #devops
5天前 · ai · - · -

[Paper] 切分梯度，扩展模型：通过梯度分区实现无服务器联邦聚合

联邦学习（FL）在无服务器平台上的聚合面临硬性的可扩展性上限：现有架构（lambda-FL、LIFL）将客户端划分到 …

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] LTBs-KAN: 线性时间 B样条 Kolmogorov‑Arnold 网络

Kolmogorov-Arnold Networks（KANs）是一种近期的神经网络架构，提供了相较于多层感知器（MLPs）更好的可解释性替代方案……

#research #paper #ai #machine-learning #computer-vision
5天前 · ai · - · -

[Paper] 多任务优化网络

多任务优化是一种强大的方法，可并行求解大量任务。然而，现有算法面临着明显的局限性：Populati...

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 观察快与慢：学习视频中的时间流动

我们如何判断一个视频是被加速还是减速的？我们如何生成不同速度的视频？虽然视频已经成为现代通信的核心……

#research #paper #ai #machine-learning #computer-vision
5天前 · ai · - · -

[Paper] Streaming Continual Learning 中的 Temporal Taskification：Evaluation Instability 的来源

Streaming Continual Learning（CL）通常通过时间划分将连续流转换为离散任务序列。我们认为这种…

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 使用生成式大型语言模型评估自动语音识别

自动语音识别（ASR）传统上使用词错误率（WER）进行评估，这一指标对意义不敏感。基于嵌入的语义度量…

#research #paper #ai #nlp
5天前 · ai · - · -

[Paper] 微调方案定义了不同的持续学习问题

持续学习（Continual Learning，CL）研究模型如何按顺序获取任务，同时保留先前学到的知识。尽管在基准测试方面取得了显著进展……

#research #paper #ai #machine-learning
5天前 · ai · - · -

[论文] 无眼观察：来自可穿戴IMU的4D人类场景理解

理解人类活动及其周围环境通常依赖视觉感知，但摄像头在隐私、安全方面仍然带来持续的挑战，...

#research #paper #ai #computer-vision
5天前 · ai · - · -

[Paper] 多校准的样本复杂度

我们研究批量设置中 multicalibration 的 minimax 样本复杂度。学习者观察到来自未知分布的 n 个 i.i.d. 样本，并且必须输出……

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] Omni模型中的上下文展开

我们提出 Omni，一个统一的多模态模型，原生训练于多种模态，包括文本、图像、视频、3D 几何和隐藏表示。我们 ...

#research #paper #ai #computer-vision
5天前 · software · - · -

[Paper] CrossCommitVuln-Bench：多提交 Python 漏洞数据集，对每次提交的静态分析不可见

我们提出了 CrossCommitVuln-Bench，这是一个精心策划的基准，包含 15 个真实世界的 Python 漏洞（CVE），其中可利用条件跨多个提交被引入。

#research #paper #software
5天前 · ai · - · -

[Paper] MathDuels：评估 LLM 作为出题者和求解者

随着前沿语言模型在静态数学基准上取得接近天花板的表现，现有评估手段日益难以区分模型之间的差异。

#research #paper #ai #nlp
5天前 · ai · - · -

[Paper] Vista4D：视频重新拍摄与4D点云

我们提出了 Vista4D，一个稳健且灵活的视频再拍摄框架，将输入视频和目标摄像机定位在 4D 点云中。具体而言，给定一个…

#research #paper #ai #computer-vision
5天前 · ai · - · -

[Paper] 当提示取代视觉时：提示诱导的幻觉在 LVLMs 中

尽管大型视觉语言模型（LVLMs）的能力取得了令人印象深刻的进展，这些系统仍然容易出现幻觉，即输出是 n...

#research #paper #ai #machine-learning #nlp #computer-vision
5天前 · ai · - · -

[Paper] 从研究问题到科学工作流：利用 Agentic AI 实现科学自动化

科学工作流系统自动化执行——调度、容错、资源管理——但不包括其前置的语义转换。Scienti...

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 方向性混淆揭示人类与机器视觉中通过率失真几何的不同归纳偏置

人类和现代视觉模型可以达到相似的分类准确率，但它们系统性地犯不同类型的错误——区别不在于错误出现的频率……

#research #paper #ai #computer-vision
5天前 · ai · - · -

[Paper] 大模型的低秩适配再探

Low-rank adaptation (LoRA) 已成为基础模型参数高效微调 (PEFT) 的事实标准，使得对 bill...

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] UniGenDet：统一的生成‑判别框架用于协同进化图像生成与生成图像检测

近年来，图像生成和生成图像检测都取得了显著进展。尽管它们发展迅速，却在很大程度上仍相互独立。

#research #paper #ai #computer-vision
5天前 · ai · - · -

[Paper] 尺度自适应框架用于基于 Diffusion Models 的时空联合超分辨率

深度学习视频超分辨率发展迅速，但气候应用通常只在空间或时间上进行超分辨率（提升分辨率），而且……

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] GiVA：梯度感知基用于基于向量的适应

随着模型规模的持续增长，参数高效微调已成为全微调的强大替代方案。虽然 LoRA 在 …

#research #paper #ai #machine-learning #nlp
5天前 · software · - · -

[Paper] 在科研计算中制度化最佳实践：用于改进用户入职的框架与案例研究

全球的 Research computing centers 在为新用户进行 onboarding 时面临困难。Subject matter experts、研究人员和 principal investigators 经常被…

#research #paper #software
5天前 · ai · - · -

[Paper] 映射巴西众议院的政治话语：多方面的计算方法

对立法行为的分析常常依赖投票记录，忽视了政治演讲中丰富的语义和修辞内容。在本文中，我们提出…

#research #paper #ai #nlp
5天前 · ai · - · -

[Paper] Nemobot Games：为交互式学习打造战略性 AI 游戏代理，使用大语言模型

本文提出了一种用于 AI 游戏编程的新范式，利用大型语言模型（LLMs）来扩展并实现 Claude Shannon 的分类法……

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 揭示地理驱动信号在区域级索赔频率模型中的作用：基于环境和视觉预测因子的实证研究

地理背景通常被认为与 motor insurance 风险相关，但公共 actuarial 数据集提供的地点标识有限，限制了对此的……

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] 多阶段暖启动深度学习框架用于机组组合

保持电力供需的瞬时平衡对于可靠性和电网不稳定性至关重要。系统运营商通过……实现此目标。

#research #paper #ai #machine-learning
5天前 · ai · - · -

[Paper] EVENT5Ws：一个用于开放域事件抽取的大规模文档数据集

事件抽取从文本中识别事件的核心要素。它支持事件理解和分析，这对于诸如知情决策等任务至关重要。

#research #paper #ai #nlp
5天前 · ai · - · -

[Paper] TingIS：企业规模下从噪声客户事件中实时发现风险事件

实时检测和缓解技术异常对于大规模云原生服务至关重要，因为即使几分钟的停机也可能导致 massi...

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts