Source

arXiv

4750 posts from this source

排序:

4个月前 · ai · - · -

[Paper] LeLaR：首个在轨演示的基于AI的卫星姿态控制器

姿态控制对于许多卫星任务至关重要。然而，Classical controllers 的设计耗时且对模型不确定性敏感，...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 大语言模型的认识论后果：重新思考集体智能和制度知识

我们审视人类与 LLM 交互所带来的 epistemological 威胁。我们发展集体 epistemology，作为一种在个体之间分布的 epistemic warrant 理论……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 拥有智能：全球 AI 专利格局与欧洲对技术主权的追求

人工智能已成为全球技术竞争的关键领域，也是欧洲追求技术主权的核心关注点。这……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] CARE 失败之处：Contrastive Anchored-REflection for Verifiable Multimodal

带有可验证奖励的群体相对强化学习（RLVR）经常浪费它已经拥有的最有信息量的数据——即失败。当所有 rollouts 都是 w...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] DFORD：基于方向反馈的在线序数回归学习

在本文中，我们在序数回归设置中引入了方向性反馈，其中学习者会收到关于预测标签是否在……的反馈。

#research #paper #ai #machine-learning
4个月前 · ai · - · -

【论文】阿尔及利亚方言

我们推出了 Algerian Dialect，一个大规模情感标注数据集，包含 45,000 条用阿尔及利亚阿拉伯方言撰写的 YouTube 评论。我们收集的评论……

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] 主动卷积照明结合深度迁移学习用于大气湍流下的复杂光束传输

大气湍流在包括光学成像、遥感和自由空间光学等广泛应用中构成了根本性的限制。

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 大语言模型中的事件抽取

大型语言模型（LLMs）和多模态LLMs正在改变事件抽取（EE）：提示和生成往往能够在零样本情况下产生结构化输出……

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] 从瞬态流动数据中学习连续溶剂效应：对Catechol Rearrangement的Graph Neural Network Benchmark

预测在连续溶剂组成范围内的反应结果仍然是有机合成和工艺化学中的一项关键挑战。传统的 m...

#research #paper #ai #machine-learning
4个月前 · software · - · -

[Paper] 超越语言边界：揭示编程语言家族以用于代码语言模型

多样化编程语言的快速激增为开发多语言代码 LLM 带来了机遇和挑战。虽然现有技术……

#research #paper #software
4个月前 · ai · - · -

[Paper] 使用 GPT-5 进行代码变更影响分析的数据集与初步研究

理解源代码的变更及其对其他代码实体的影响是软件开发中的关键技能。然而，对代码变更的分析以及……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 大语言模型框架用于自动化人道主义形势报告

及时且准确的情境报告对于人道主义决策至关重要，然而当前的工作流仍然在很大程度上是手动的、资源密集型的，并且…

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] 更快的分布式仅推理推荐系统 via Bounded Lag Synchronous Collectives

推荐系统是实现个性化内容投放（从而带来收入）的关键技术，广泛用于许多大型公司。在过去十年中，深度学习推荐……

#research #paper #ai #machine-learning
4个月前 · devops · - · -

[论文] Strongly Sublinear MPC 与 Node‑Capacitated Clique 之间的模拟

我们研究强子线性 MPC 模型与经典的 graph‑centric 分布式模型之间的关系，重点关注 Node‑Capacitated Clique (NCC)，一种带宽……

#research #paper #devops
4个月前 · ai · - · -

[Paper] 学习辅助的多算子可变邻域搜索用于城市电缆路由

城市地下电缆建设对于提升城市电网的可靠性至关重要，但其高昂的建设成本使得规划变得值得……

#research #paper #ai
4个月前 · software · - · -

[Paper] 基于语义等价转换的神经代码模型后门攻击：特征化与缓解

Neural code models 已日益被纳入软件开发流程。然而，它们对 backdoor attacks 的易感性带来了显著…

#research #paper #software
4个月前 · devops · - · -

[Paper] L4：通过基于长度感知的调度实现低延迟和负载均衡的 LLM 服务

高效利用 GPU 计算对于提升用户体验和降低大语言模型（LLM）服务的运营成本至关重要。然而，当前...

#research #paper #devops
4个月前 · software · - · -

[Paper] 大学租金促进企业创新：在 R 语言生态系统中映射学术研究者的编码与话语劳动

本文通过对研究者编码和对R的论述性贡献的分析，探讨了未被认可的劳动在企业创新系统中的作用，……

#research #paper #software
4个月前 · ai · - · -

[论文] Evidential Trust-Aware Model Personalization 在 Decentralized Federated Learning 中用于 Wearable IoT

去中心化联邦学习（Decentralized federated learning，DFL）使得在边缘设备之间进行协作模型训练成为可能，无需中心化协调，提供了对 ...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[论文] BanglaForge：LLM 协作与 Self-Refinement 用于 Bangla 代码生成

Bangla 是一种代码生成的低资源语言，缺乏大规模标注数据集和将自然语言规范转换为可执行代码的工具。

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] Over-the-Air 联邦学习中的及时参数更新

将 over-the-air computations (OAC) 融入联邦学习 (FL) 的模型训练过程是一种有效的方式，以缓解通信……

#research #paper #ai #machine-learning
4个月前 · software · - · -

[Paper] PEAK：一种基于自然语言转换的 GPU 内核性能工程 AI 助手

大型语言模型（LLMs）的进展正显示出对软件开发和编程辅助的有希望的影响。然而，这些模型在……方面仍然存在困难。

#research #paper #software
4个月前 · software · - · -

[Paper] 模块化布局合成 (MLS)：通过结构归一化和约束生成的前端代码

自动化前端工程显著缩短开发周期并最小化手动编码开销。虽然 Generative AI 在翻译方面展现出潜力……

#research #paper #software
4个月前 · software · - · -

[论文] Scrum Sprint 规划：基于 LLM 的算法解决方案

对即将到来的项目迭代（sprint）的规划是 Scrum 规划中的关键活动之一。本文中，我们展示了正在进行的关于探索 … 的工作。

#research #paper #software
4个月前 · ai · - · -

[Paper] 基于聚类的迁移学习用于动态多模态多目标进化算法

动态多模态多目标优化呈现出双重挑战：既要同时跟踪多个等价的Pareto最优集合，又要保持Pareto前沿的……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[论文] FASTRIC：可验证 LLM 交互的提示规范语言

大型语言模型（LLMs）执行复杂的多轮交互协议，但缺乏正式规范来验证其执行是否符合设计者的意图。我们…

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] 少即是多：8-bit Quantization 提升 Large Language Models 的 Continual Learning

Catastrophic forgetting 在 continual learning 中构成了根本性的挑战，尤其是当模型为了 deployment efficiency 而被 quantized 时。我们系统地……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[论文] 指出你的意思：Visually Grounded Instruction Policy

Vision-Language-Action (VLA) 模型将视觉和语言与具身控制对齐，但当仅依赖于 t 时，它们的对象指代能力仍然有限。

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] DPSR：差分隐私稀疏重建通过多阶段去噪用于推荐系统

差分隐私（DP）已成为保护推荐系统中用户数据的黄金标准，但现有的隐私保护机制面临着困难……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] LouvreSAE：稀疏自编码器用于可解释且可控的风格迁移

在生成模型中进行艺术风格迁移仍然是一个重大挑战，因为现有方法通常仅通过 model fine-tuning、additional a...

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] 非线性数据同化的 Ensemble Schrödinger Bridge 滤波器

本工作提出了一种新颖的非线性最优滤波器，即 Ensemble Schrödinger Bridge 非线性滤波器。所提出的滤波器实现了 sta 的结合。

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 合并在不相交数据集上训练的 Kolmogorov‑Arnold 网络

在不相交的数据集上进行训练可以实现两个主要目标：加速数据处理和实现联邦学习。已经确定 Ko...

#research #paper #ai #machine-learning
4个月前 · devops · - · -

[Paper] 基于QoS的计算连续体负载均衡：多玩家Bandits

随着计算从云端转向边缘以降低处理延迟和网络流量，产生的计算连续体（Computing Continuum，CC）创建了一个动态的环境……

#research #paper #devops
4个月前 · ai · - · -

[Paper] Delta-LLaVA：Base-then-Specialize 对齐用于令牌高效的视觉语言模型

多模态大型语言模型（MLLMs）结合视觉和文本表示，以实现丰富的推理能力。然而，高计算成本……

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] Remedy‑R：用于机器翻译评估的生成式推理，无需错误标注

多年来，自动 MT 指标已经在基准上不断攀升，并且在与人工评分的吻合度上表现出强劲且有时达到人类水平的一致性。然而，它们仍然 bl...

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] Gabliteration：自适应多方向神经权重修改用于大语言模型的选择性行为改变

我们提出 Gabliteration，这是一种新颖的神经权重修改技术，通过实现自适应多方向……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 超越标签的思考：Vocabulary-Free 细粒度识别，基于 Reasoning-Augmented LMMs

Vocabulary-free fine-grained image recognition 旨在在没有固定的人为定义标签集的情况下，区分元类内部视觉上相似的类别。Exi...

#research #paper #ai #computer-vision
4个月前 · devops · - · -

[Paper] 实时数字孪生用于自适应调度

高性能计算（HPC）工作负载正变得日益多样化，作业特征呈现出很大的变动性，然而集群调度仍然……

#research #paper #devops
4个月前 · ai · - · -

[Paper] 在像素空间通过序数评分相关性定位 Shortcut Learning 以实现 Attribution Representations (OSCAR)

深度神经网络经常利用捷径。这些是与训练数据中的输出标签相关联的虚假线索，但与任务语义无关。

#research #paper #ai #computer-vision
4个月前 · devops · - · -

[Paper] EuroHPC SPACE CoE：为 Exascale 重新设计可扩展并行天体物理代码

基于高性能计算（HPC）的模拟在天体物理学和宇宙学（A&C）中至关重要，帮助科学家研究和理解复杂的……

#research #paper #devops
4个月前 · ai · - · -

[Paper] 大语言模型能估计学生的学习困难吗？人机难度对齐与熟练度模拟用于题目难度预测

对项目（题目或任务）难度的准确估计对教育评估至关重要，但面临冷启动问题。虽然大型语言模型…

#research #paper #ai #machine-learning #nlp
4个月前 · ai · - · -

[Paper] 深度学习方法在中世纪历史文献转录中的应用

手写文本识别和光学字符识别解决方案在处理现代时代的数据时表现出色，但效率在 La... 时会下降。

#research #paper #ai #machine-learning #nlp #computer-vision
4个月前 · ai · - · -

[论文] 工作空间上的合并作为 Hopf 代数马尔可夫链

我们研究了一个 Hopf 代数 Markov 链的动力学性质，其状态空间是带标签叶子的二叉根森林。这个 Markov 动力系统……

#research #paper #ai #nlp
4个月前 · ai · - · -

[论文] Remoe：面向高效且低成本的 MoE 推理在无服务器计算中的实现

Mixture-of-Experts（MoE）已成为大规模语言模型（LLMs）中的主导架构，因为它能够通过稀疏专家激活来扩展模型容量……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 跨模态神经形态计算中的模态依赖记忆机制

记忆增强的脉冲神经网络（SNN）有望实现能效高的类脑计算，但它们在不同感官模态间的泛化仍未得到充分验证……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 基准测试元启发式算法用于具有多策略的可维修系统的双目标冗余分配问题

本文研究了可修复系统的双目标冗余分配问题（RAP），其目标定义为成本最小化和可用性最大化……

#research #paper #ai
4个月前 · ai · - · -

[Paper] 语义与重建同等重要：让表示编码器准备好用于文本到图像生成与编辑

现代潜在扩散模型（LDM）通常在低层次的变分自编码器（VAE）潜在空间中运行，这些空间主要针对像素级的重建进行优化。

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] Re-Depth Anything: 测试时深度细化通过自监督再照明

单目深度估计仍然具有挑战性，因为最近的基础模型，如 Depth Anything V2 (DA-V2)，在处理与真实世界图像相差甚远的情况时表现不佳。

#research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts