machine-learning — Page 4

排序:

1周前 · ai · - · -

[论文] MoRight：运动控制做对了

生成动作控制视频——在用户指定的动作驱动下，实现自由选择视点的物理上合理的场景动态——需要两种能力……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 对生成式 AI 工作负载功耗特征的测量，以用于全设施数据中心基础设施规划

生成式人工智能（AI）的快速增长带来了前所未有的计算需求，导致能源足迹显著增加。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] Personalized RewardBench：评估具有人类对齐个性化的奖励模型

多元对齐已成为大型语言模型（LLMs）发展中的关键前沿，奖励模型（RMs）作为核心机制……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] RoSHI：一种用于野外人类数据的多功能机器人导向套装

扩大机器人学习的规模可能需要包含丰富且长期交互的人类数据，且这些数据来源于真实环境。现有的收集此类数据的方法……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 如何勾画学习算法

training data 的选择如何影响 AI model？这个问题对 interpretability、privacy 和 basic science 具有核心重要性。其核心在于……

#research #paper #ai #machine-learning
1周前 · ai · - · -

【论文】异步 Q-learning 的高斯近似

在本文中，我们推导了在高维中心极限定理下，由异步 Q 产生的 Polyak‑Ruppert 平均迭代的收敛速率。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 语法容易，语义困难：评估 LLMs 在 LTL 翻译中的表现

命题线性时序逻辑（LTL）是一种流行的形式化方法，用于指定软件、网络等的期望需求以及安全和隐私策略。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 评估 In-Context 翻译与 Synchronous Context-Free Grammar Transduction

低资源语言对使用大型语言模型（LLMs）的机器翻译构成挑战，因为这些模型需要大量的训练数据。一个潜在的 w...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] SL-FAC：一种通信高效的分割学习框架，具备频率感知压缩

神经网络日益增长的复杂性阻碍了在资源受限设备上部署分布式机器学习。拆分学习（Split learning，SL）提供了一种…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 区域图最优传输路由用于混合专家全切片图像分类

多实例学习（MIL）是计算病理学中用于千兆像素全切片图像（WSI）分类的主导框架。然而，当前的MIL……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] Graph Neural ODE Digital Twins 用于部分可观测条件下的面向控制的反应堆热工水力预测

先进堆的实时监督控制需要对全厂热工水力状态进行精确预测，包括物理传感器所在的位置……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 为 AI 腾出空间：Multi-GPU 分子动力学与 GROMACS 中的 Deep Potentials

GROMACS 是经典分子动力学（MD）的事实标准。AI 驱动的原子间势能的兴起，旨在通过 MD 实现接近量子水平的精度。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 关于语言识别与生成的隐私代价

随着大型语言模型（LLMs）越来越多地在敏感用户数据上进行训练，理解隐私在语言学习中的基本代价变得至关重要。

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] TraceSafe：对 LLM Guardrails 在多步骤工具调用轨迹上的系统评估

随着大型语言模型（LLMs）从静态聊天机器人演变为自主代理，主要的漏洞面从最终输出转向中间……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[论文] NestPipe：在 1,500+ 加速器上通过嵌套流水线进行大规模推荐训练

现代 recommendation models 的参数已增长至数万亿。随着 cluster 规模扩展到约 O(1k)，distributed training 的瓶颈从计算…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 通过自适应 IND-CPA 测试使用深度学习评估 PQC KEMs、Combiners 和 Cascade Encryption

确保密文不可区分性是密码学安全的基础，但在实际实现和混合系统中经验性地验证这一属性……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] VertAX：一种可微分顶点模型用于学习上皮组织力学

上皮组织通过细胞之间的局部机械相互作用动态重塑，这一过程被 vertex models 很好地捕捉。然而，它们拥有众多可调参数……

#research #paper #ai #machine-learning
1周前 · ai · - · -

带时间窗的旅行窃贼问题：基准与启发式

虽然传统的优化问题常常是孤立研究的，但如今许多现实世界的问题需要多个优化组件之间的相互依赖……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[论文] 原位测试时训练

静态的“train then deploy”范式从根本上限制了大型语言模型（LLMs）在面对持续的…

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 小直径垂直管道中 Churn Flow 的拓扑特征化及对 Wu Flow-Regime Map 的无监督校正

Churn flow——垂直两相流中的混沌、振荡状态——在过去40多年里缺乏定量的数学定义。我们首次…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] HaloProbe：贝叶斯检测与缓解视觉语言模型中的对象幻觉

大型视觉语言模型可能在图像描述中产生对象幻觉，这凸显了有效检测和缓解策略的需求。P...

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] Character Error Vector：可分解错误用于页面级 OCR 评估

字符错误率（CER）是评估光学字符识别（OCR）质量的关键指标。然而，该指标假设文本已经…

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[论文] 目标策略优化

在强化学习（RL）中，给定一个提示（prompt），我们从模型中采样一组补全（completions）并对它们进行评分。随后会出现两个问题：哪些补全应该获得概率质量（probability mass），以及……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] MMEmb‑R1: 推理增强的多模态嵌入与配对感知选择及自适应控制

MLLMs 已成功应用于多模态嵌入任务，但它们的生成推理能力仍未得到充分利用。直接将 cha...

#research #paper #ai #machine-learning #nlp #computer-vision
1周前 · ai · - · -

[Paper] 面向一致的世界模型的多标记预测与潜在语义增强

是否大型语言模型（LLMs）能够形成连贯的内部世界模型仍是核心争论。传统的下一标记预测（Next-Token Prediction，NTP）侧重于单个……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 谁在治理机器？跨企业和地缘政治边界的 AI 系统机器身份治理分类法 (MIGT)

人工智能治理存在盲点：AI 系统用于行动的机器身份。AI agents、service accounts、API tokens，以及 auto...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 基于Shot的量子编码：量子神经网络的数据加载范式

高效的数据加载仍然是近期量子机器学习的瓶颈。现有方案（angle、amplitude 和 basis 编码）要么未充分利用 …

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] PoM：一种线性时间的 Attention 替代方案，使用 Polynomial Mixer

本文介绍了多项式混合器（Polynomial Mixer，PoM），这是一种具有线性复杂度的新型 token mixing 机制，可直接替代 self-attention....

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[论文] Gym-Anything：将任何软件转化为 Agent 环境

计算机使用代理有望在广泛的数字经济活动中提供帮助。然而，当前的研究主要集中在短期视角……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 轻量化多模态适配视觉语言模型用于无人机热成像中的物种识别与栖息地上下文解释

本研究提出了一种轻量级多模态适配框架，以弥合 RGB 预训练 VLMs 与热红外影像之间的表征差距，并……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 社会动态作为削弱 LLM 集体客观决策的关键漏洞

大型语言模型（LLM）代理正日益在多代理环境中充当人类代表，在这种环境中，代表代理整合多样的同行…

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

主算法

《The Master Algorithm》– 2015 → 2025 2015 年，人工智能研究员 Pedro Domingos 发表了一本书：《The Master Algorithm: How the Quest for the Ultimate Learning…》。

#master algorithm #neural networks #machine learning #Pedro Domingos #AI tribes
1周前 · ai · - · -

[Paper] LAG‑XAI：一种受 Lie 启发的仿射几何框架，用于 Transformer 潜在空间中的可解释改写

现代基于Transformer的语言模型在自然语言处理任务中表现出色，但它们的潜在语义空间仍然在很大程度上未被……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 基于双自一致强化学习的科学图形程序合成

Graphics Program Synthesis 对于解释和编辑视觉数据至关重要，有效促进了将静态视觉内容逆向工程为可编辑的形式……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 他人视角的你的生活故事：基于丰富心理测量画像的 LLM 生成生活故事的往返评估

人格特质在自然语言中被丰富地编码，而在人工文本上训练的大型语言模型（LLMs）在以提示为条件时可以模拟人格。

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] QiMeng-PRepair：通过编辑感知奖励优化实现精确代码修复

Large Language Models (LLMs) 在程序修复方面表现出色，但常常出现过度编辑的问题，即过多的修改会覆盖正确的代码……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 神经网络剪枝通过 QUBO 优化

Neural network pruning 可以被表述为一个 combinatorial optimization 问题，但大多数现有方法依赖于忽视复杂 int... 的 greedy heuristics。

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] CAKE：大语言模型的云架构知识评估

在当今的 software architecture 中，large language models (LLMs) 充当 software architecture co-pilots。然而，目前没有 benchmark 来评估 large...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] SemLink：一种语义感知的自动化测试Oracle，用于使用Siamese Sentence-BERT的超链接验证

Web 应用程序在很大程度上依赖超链接来连接不同的信息资源。然而，网络的动态特性导致链接腐烂（link rot），即目标…

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 你的预训练扩散模型暗中了解修复

预训练的扩散模型推动了全能修复（All-in-One Restoration，AiOR）的显著进展，提供了更好的感知质量和泛化能力。Ho...

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 使用Signal Temporal Logic对强化学习进行分层

在本文中，我们开发了一种基于分层的 Signal Temporal Logic (STL) 语义，其中每个原子谓词被解释为 membership test in……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] PINNs 在 PDE 受约束的最优控制问题中的直接方法与间接方法

我们研究 physics-informed neural networks (PINNs) 作为求解半线性偏微分方程最优控制的数值工具。我们首先回顾 c...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] Vero：通用视觉推理的开放RL配方

要构建一个能够跨图表、科学、空间理解和开放式任务的 visual reasoner，需要什么条件？最强大的 vision-language model……

#research #paper #ai #machine-learning #nlp #computer-vision
1周前 · ai · - · -

[Paper] QED-Nano：教一个小模型去证明困难定理

专有 AI 系统最近在复杂的基于证明的问题上展示了令人印象深刻的能力，据报道在 2025 Inte... 中实现了 gold-level performance。

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 重新思考 RLVR 中的探索：从熵正则化到通过双向熵调制的细化

可验证奖励的强化学习（RLVR）显著提升了大型语言模型（LLMs）的推理能力。然而，它面临着…

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[论文] μ子动力学作为谱 Wasserstein 流

梯度归一化在深度学习优化中至关重要，因为它能够稳定训练并降低对尺度的敏感性。对于深层架构，参数…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 用于训练机器学习工程智能体的合成沙盒

随着大型语言模型代理从软件工程（SWE）任务向机器学习工程（MLE）迈进，验证代理行为变得……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 采样并行用于快速高效的贝叶斯学习

机器学习模型，尤其是深度神经网络，正日益在诸如医疗保健、环境预测等风险敏感领域中得到部署，……

#research #paper #ai #machine-learning

Newer posts

Older posts