Source

arXiv

4602 posts from this source

排序:

1周前 · devops · - · -

[Paper] 面向 HPC 的节能协同调度

现代多GPU HPC系统提供了巨大的计算能力，但低效的GPU分配常导致能源浪费和利用率不足。在实践中...

#research #paper #devops
1周前 · ai · - · -

[Paper] 关于遗传编程中符号回归的泛化界限

符号回归（SR）与遗传编程（GP）旨在直接从数据中发现可解释的数学表达式。尽管它在经验上表现强劲……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 单调却激动人心：关于演化高非线性单调布尔函数的研究

单调布尔函数是结构上重要的一类布尔函数，但它们受限的形式对可实现的非线性…

#research #paper #ai
1周前 · ai · - · -

[Paper] VIBE：语音诱导的开放式偏见评估用于大规模音频语言模型的真实世界语音

大型音频语言模型（Large Audio-Language Models，LALMs）正日益融入日常应用，但它们的生成偏差仍未得到充分研究。现有的语音公平…

#research #paper #ai #nlp
1周前 · ai · - · -

[论文] DORA Explorer：在无需训练的情况下提升 LLM 的探索能力

尽管进展迅速，用于序列决策的 LLM（即 LLM 代理）仍然难以产生多样化的输出。这导致了探索不足……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] RemoteShield：实现稳健的多模态大语言模型用于地球观测

一个稳健的用于地球观测的多模态大语言模型（MLLM）应在真实的输入变化下保持一致的解释和推理。...

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 利用画像感知的多模态 LLM 提升零样本个性化图像美学评估

个性化图像美学评估（PIAA）旨在预测单个用户对图像的主观评分，这需要对用户特定的美学……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 基于条纹投影的视觉流水线用于自动硬盘拆解

未回收的 e-waste 代表了巨大的经济损失。硬盘驱动器（HDD）构成了有价值的 e-waste 流，需要机器人拆解。Automa...

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 一种多代理方法用于从表格数据文档进行声明验证

我们提出了一种用于从表格数据文档中进行声明验证的新方法。近期基于 LLM 的方法要么采用复杂的预训练/微调，要么…

#research #paper #ai #nlp
1周前 · ai · - · -

[论文] 区域亲和注意力用于深紫外成像下的全切片乳腺癌分类

乳腺癌诊断需要快速且精确的工具，但传统的组织病理学方法在术中常常不足。Deep Ultraviole...

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] Vision-Language模型中的跨模态注意力分析与优化：关于视觉可靠性的研究

视觉语言模型（VLMs）实现了强大的跨模态性能，但最新证据表明，它们过度依赖文本描述，而对...利用不足。

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 揭开在线对齐方法非理性高效性的谜团

基于纯贪婪更新的迭代对齐方法在实践中表现出惊人的有效性，然而现有的 (O(log T)) KL 正则化的理论保证仍然有限。

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 为摘要校准模型驱动评估指标

近期在摘要评估方面的进展是基于 model-based metrics 来评估质量维度，例如 completeness、conciseness 和 faithfulness。然而...

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] 完全并行密集连接的概率 Ising 机器带惯性用于实时应用

Ising machines —— 用于启发式求解 Ising 优化问题的专用硬件 —— 基于概率位（p-bits）已经建立了……

#research #paper #ai
1周前 · ai · - · -

[论文] 当 Spike Sparsity 未能转化为部署成本时：VS‑WNO 在 Jetson Orin Nano 上

Spiking neural operators 对于 neuromorphic edge computing 具有吸引力，因为 event-driven substrates 原则上可以将稀疏活动转化为更低的 l…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 重新利用 3D 生成模型进行自回归布局生成

我们介绍 LaviGen，一个将 3D 生成模型重新用于 3D 布局生成的框架。不同于之前从文本推断对象布局的方法……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] FineCog-Nav：整合细粒度认知模块用于零样本多模态无人机导航

UAV 视觉语言导航（VLN）要求代理从自我中心视角在复杂的 3D 环境中导航，同时遵循模糊的多步骤 i...

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 增强雾霾野生动物图像：AnimalHaze3k 与 IncepDehazeGan

大气雾霾显著降低了野生动物影像的质量，阻碍了对保护至关重要的计算机视觉应用，如动物检测、跟踪、……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 通过观测到的随机动力学对自编码器进行几何正则化

具有慢或亚稳行为的随机动力系统在长时间尺度上，在高维环境空间中的未知低维流形上演化。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 使用大型语言模型和知识图谱提升制造业机器学习模型的可解释性

以透明且用户友好的方式解释机器学习（ML）结果仍然是可解释人工智能（XAI）的一个挑战性任务。In t...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 评估大型语言模型在小分子药物设计中的能力进展

大型语言模型（LLMs）有潜力加速小分子药物设计，因为它们能够对来自多种来源的信息进行推理……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 学习具备洞察的推理用于非形式定理证明

虽然大多数 automated theorem‑proving 方法依赖于 formal proof systems，informal theorem proving 可以更好地与 large language models 的 …

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 没有普遍礼貌：跨语言、多模型研究礼貌对 LLMs 的影响（使用 PLUM Corpus）

本文探讨了大型语言模型（LLMs）对不同礼貌程度和不礼貌程度的用户提示的响应。礼貌理论由...

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] VEFX-Bench：全方位基准用于通用视频编辑与视觉特效

随着 AI-assisted video creation 越来越实用，instruction-guided video editing 已成为细化生成或捕获的 footage 的关键。

#research #paper #ai #machine-learning #nlp #computer-vision
1周前 · ai · - · -

[Paper] 从基准测试到推理：对越南法律文本的双维度大规模 LLM 评估

越南法律文本的复杂性对公众获取司法构成了显著障碍。虽然Large Language Models提供了一种有前景的解决方案……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[论文] Hero-Mamba：基于 Mamba 的双域学习用于水下图像增强

水下图像常因光在水中的吸收和散射而出现严重的退化，如颜色失真、对比度低以及细节模糊。

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] FL-MHSM：空间自适应融合与集成学习用于洪水‑滑坡多灾害易损性映射（区域尺度）

现有的 multi-hazard susceptibility mapping (MHSM) 研究通常依赖空间上均匀的模型，独立处理各类灾害，并且提供的表征有限……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 信息路由器用于缓解视觉语言模型中的模态主导性

Vision Language models (VLMs) 已在广泛的基准测试中展示了强大的性能，但它们常常受到模态主导的影响，即在预测…

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] SwanNLP 在 SemEval-2026 Task 5：基于LLM的叙事词义消歧合理性评分框架

最近在语言模型方面的进展显著提升了自然语言理解（NLU）。尽管广泛使用的基准测试表明，大型语言模型……

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] 视觉-语言模型真的能进行视觉推理吗？对模态差距的严谨研究

在 vision-language models (VLMs) 中的推理最近因其在各种下游任务中的广泛适用性而受到显著关注。然而，...

#research #paper #ai #nlp #computer-vision
1周前 · ai · - · -

[Paper] 视觉语言模型的失效点在哪里？全球尺度图像地理定位分析

图像地理定位传统上通过基于检索的地点识别或基于几何的视觉定位流水线来解决。最近的进展……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 基于Joint-Centric的Dual Contrastive Alignment，结合Structure-Preserving和Information-Balanced正则化

我们提出 HILBERT（HIerarchical Long-sequence Balanced Embedding with Reciprocal contrastive Training），一种跨注意力的多模态框架，用于学习文档……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[论文] Find, Fix, Reason：视频推理的上下文修复

Reinforcement learning 已经推动了 video reasoning 在 large multi-modal models 中的发展，但主流流水线要么依赖于 on-policy self-exploration，这会导致性能停滞……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 检测与抑制 Reward Hacking 的 Gradient Fingerprints

强化学习与可验证奖励（RLVR）通常优化结果奖励，而不对中间推理施加约束。这留下……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] CollideNet：层次多尺度视频表示学习与解耦用于碰撞时间预测

Time-to-Collision (TTC) 预测是碰撞预防中的关键任务，需要精确的时间预测并理解局部和全局的…

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 使用概率偏差校正提升 AI 与动力学次季节预报

决策者依赖天气预报来种植作物、管理野火、分配水和能源，并为极端天气做好准备。今天，这类预报 e...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 通过 Token Pruning 优化韩语为中心的 LLMs

本文系统性地基准评估了通过 token pruning 适配的最先进的多语言大型语言模型（LLMs）——一种压缩技术……

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] 超越表面统计：通过内部表征实现对LLMs的稳健共形预测

大型语言模型正日益在可靠性至关重要的场景中部署，但输出层面的不确定性信号，如 token probabilities、entropy……

#research #paper #ai #machine-learning #nlp
1周前 · software · - · -

[Paper] 研究对话代理以支持中学生学习CSP

就读AP Computer Science Principles（CSP）课程的中学生通常会利用网络资源（例如教程、Q&A网站）来更好地……

#research #paper #software
1周前 · software · - · -

[Paper] 从论文到进步：重新思考软件工程中的知识积累

软件工程研究在过去几十年中在产出和参与度方面都经历了快速增长。然而，人们仍然对该领域的能力……

#research #paper #software
1周前 · software · - · -

[Paper] 弥合用户意图与LLM之间的差距：一种需求对齐方法用于代码生成

代码生成是指根据用户需求自动生成可执行程序。最近，研究人员已经探索了提升 corr… 的方法。

#research #paper #software
1周前 · ai · - · -

[Paper] JumpLoRA：用于大语言模型持续学习的稀疏适配器

基于适配器的方法已成为对大型语言模型（LLMs）进行持续学习（CL）的成本有效方案，通过顺序学习低秩更新……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] AtManRL：通过可微注意力显著性实现可信推理

大型语言模型（LLMs）日益依赖链式思考（CoT）推理来解决复杂任务。然而，确保推理轨迹既能……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 关于基于代理的测试时对齐的拒绝准则

最近的工作提出了 test-time alignment 方法，依赖一个小的 aligned model 作为代理，引导更大的 base（unaligned）model 的生成。T...

#research #paper #ai #nlp
1周前 · ai · - · -

[论文] 混合精度分布式训练的训练时间预测

在分布式深度学习中，准确预测训练时间对于资源分配、成本估算和作业调度至关重要。我们观察到，f...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 德国手语童话的情感分析

我们提出了一个用于德国语手语（DGS）童话的 dataset 和 model，用于进行 sentiment analysis。首先，我们对三个层面的 val…

#research #paper #ai #machine-learning #nlp
1周前 · devops · - · -

[Paper] 对数时间测地凸分解在可编程物质中

将复杂结构分解为更简单的子结构是一种强大的技术，具有广泛的应用范围。我们研究了 decomp 的计算……

#research #paper #devops
1周前 · devops · - · -

[Paper] 组合式设计、实现与验证 Swarms (技术报告)

Swarm protocols 是一种最近引入的形式化方法，用于指定、实现和验证称为 swarms 的点对点系统。一个 swarm 由分布式…

#research #paper #devops

Newer posts

Older posts