EUNO.NEWS EUNO.NEWS
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
  • All (20543) +144
    • AI (3117) +9
    • DevOps (914) +5
    • Software (10652) +105
    • IT (5812) +25
    • Education (48)
  • Notice
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 1个月前 · ai

    [Paper] 生成式对抗推理器:通过对抗强化学习提升 LLM 推理能力

    Large language models (LLMs) 具备显式推理能力,在数学推理方面表现出色,但仍会出现过程错误,例如计算错误……

    #research #paper #ai #machine-learning #nlp
  • 1个月前 · ai

    [Paper] StereoPilot:通过生成先验学习统一且高效的立体转换

    立体显示技术的快速增长,包括 VR 头盔和 3D 影院,导致对高质量立体视频内容的需求不断增加。然而,pr...

    #research #paper #ai #computer-vision
  • 1个月前 · ai

    [Paper] 构造性电路放大:通过针对性子网络更新提升LLMs的数学推理

    先前研究调查大型语言模型(LLMs)的内部工作原理时,发现了稀疏子网络,通常称为 circuits,负责执行……

    #research #paper #ai #nlp
  • 1个月前 · ai

    [Paper] Depth Any Panoramas: 全景深度估计的基础模型

    在本工作中,我们提出了一种全景度量深度基础模型,能够在不同场景距离上实现泛化。我们探索了一种 data‑in‑the‑loop 范式……

    #research #paper #ai #computer-vision
  • 1个月前 · ai

    [Paper] 探索 vs. 利用:通过 Clipping、Entropy 和 虚假奖励 重新思考 RLVR

    本文研究了在可验证奖励(RLVR)强化学习框架中探索‑利用的权衡,这一框架用于提升推理的……

    #research #paper #ai #machine-learning #nlp
  • 1个月前 · ai

    [Paper] 后验行为克隆:为高效RL微调预训练BC策略

    在从机器人到语言等各个领域,标准做法是首先在大规模 demonstration dataset 上对 policy 进行 pretrain,然后对该 policy 进行 finetune,……

    #research #paper #ai #machine-learning
  • 1个月前 · ai

    [Paper] SFTok:弥合离散分词器的性能差距

    近期在多模态模型方面的进展凸显了图像标记化在高分辨率图像生成中的关键作用。通过将图像压缩成紧凑的...

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [Paper] 从推理到运动的流动:从第一人称人类交互视频中学习3D手部轨迹预测

    先前关于3D 手部轨迹预测的工作受到数据集的限制,这些数据集将运动与语义监督解耦,并且模型在推理方面的关联较弱。

    #research #paper #ai #machine-learning #computer-vision
  • 1个月前 · ai

    [Paper] 后置水印在语言模型改写中的效果如何?

    生成时文本水印将统计信号嵌入文本,以实现对 AI 生成内容的可追溯性。我们探索 *post-hoc watermarking*,其中 LLM…

    #research #paper #ai #nlp
  • 1个月前 · ai

    [Paper] 上下文代数

    我们研究当 transformer 被训练用于在序列上求解算术时出现的机制,这些序列中的 token 是其含义由…决定的变量。

    #research #paper #ai #machine-learning #nlp
  • 1个月前 · ai

    [Paper] 新闻 AI 的历史训练数据中种族偏见的影响

    AI 技术已迅速进入涉及大规模文本语料库的商业和研究应用领域,包括 computational journalism 研究和新闻……

    #research #paper #ai #machine-learning #nlp
  • 1个月前 · ai

    [Paper] Multimodal RewardBench 2:评估用于交错文本和图像的 Omni Reward Models

    奖励模型(RMs)对于训练大型语言模型(LLMs)至关重要,但在处理交错图像和文本序列的 omni models 方面仍未得到充分研究。

    #research #paper #ai #nlp #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026