ai — Page 79 | EUNO.NEWS

1个月前 · ai

[Paper] Depth Any Panoramas: 全景深度估计的基础模型

在本工作中，我们提出了一种全景度量深度基础模型，能够在不同场景距离上实现泛化。我们探索了一种 data‑in‑the‑loop 范式……

#research #paper #ai #computer-vision
1个月前 · ai

[Paper] 探索 vs. 利用：通过 Clipping、Entropy 和虚假奖励重新思考 RLVR

本文研究了在可验证奖励（RLVR）强化学习框架中探索‑利用的权衡，这一框架用于提升推理的……

#research #paper #ai #machine-learning #nlp
1个月前 · ai

[Paper] 后验行为克隆：为高效RL微调预训练BC策略

在从机器人到语言等各个领域，标准做法是首先在大规模 demonstration dataset 上对 policy 进行 pretrain，然后对该 policy 进行 finetune，……

#research #paper #ai #machine-learning
1个月前 · ai

[Paper] SFTok：弥合离散分词器的性能差距

近期在多模态模型方面的进展凸显了图像标记化在高分辨率图像生成中的关键作用。通过将图像压缩成紧凑的...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[Paper] 从推理到运动的流动：从第一人称人类交互视频中学习3D手部轨迹预测

先前关于3D 手部轨迹预测的工作受到数据集的限制，这些数据集将运动与语义监督解耦，并且模型在推理方面的关联较弱。

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[Paper] 后置水印在语言模型改写中的效果如何？

生成时文本水印将统计信号嵌入文本，以实现对 AI 生成内容的可追溯性。我们探索 *post-hoc watermarking*，其中 LLM…

#research #paper #ai #nlp
1个月前 · ai

[Paper] 上下文代数

我们研究当 transformer 被训练用于在序列上求解算术时出现的机制，这些序列中的 token 是其含义由…决定的变量。

#research #paper #ai #machine-learning #nlp
1个月前 · ai

[Paper] 新闻 AI 的历史训练数据中种族偏见的影响

AI 技术已迅速进入涉及大规模文本语料库的商业和研究应用领域，包括 computational journalism 研究和新闻……

#research #paper #ai #machine-learning #nlp
1个月前 · ai

[Paper] Multimodal RewardBench 2：评估用于交错文本和图像的 Omni Reward Models

奖励模型（RMs）对于训练大型语言模型（LLMs）至关重要，但在处理交错图像和文本序列的 omni models 方面仍未得到充分研究。

#research #paper #ai #nlp #computer-vision
1个月前 · ai

[Paper] LinkedOut：从 Video LLM 中链接世界知识表示以实现下一代视频推荐

视频大型语言模型（VLLMs）通过在互联网规模的数据上进行预训练，解锁了具备世界知识感知的视频理解，并已显示出前景……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai

[Paper] AdaSearch：在大语言模型中通过强化学习平衡参数化知识与搜索

通过强化学习（RL）为大型语言模型（LLMs）配备搜索引擎已成为构建搜索代理的有效方法。Howe...

#research #paper #ai #nlp
1个月前 · ai

[论文] Cartesian-nj：将 e3nn 扩展到不可约笛卡尔张量乘积和收缩

等变原子级机器学习模型在外推能力和预测精度方面都带来了显著提升。取决于…的基础，

#research #paper #ai #machine-learning

Newer posts

Older posts