EUNO.NEWS EUNO.NEWS
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
  • All (20543) +144
    • AI (3117) +9
    • DevOps (914) +5
    • Software (10652) +105
    • IT (5812) +25
    • Education (48)
  • Notice
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 3周前 · ai

    [Paper] 贝尔曼校准用于离线强化学习中的 V-Learning

    我们引入 Iterated Bellman Calibration,这是一种简单、模型不可知、事后(post‑hoc)校准 off‑policy 价值预测的程序,适用于无限时域的 Markov …

    #research #paper #ai #machine-learning
  • 3周前 · ai

    [Paper] 用细粒度人类反馈对文本片段微调 LLMs

    我们提出了一种方法和数据集,用于在偏好监督下通过反馈驱动的改进链对语言模型进行微调。给定模型的响应,……

    #research #paper #ai #nlp
  • 3周前 · ai

    [Paper] PROFASR-BENCH:针对高风险专业语音的上下文条件化 ASR 基准

    在专业环境中的自动语音识别(ASR)面临着现有基准低估的挑战:密集的领域术语、正式语体的变体……

    #research #paper #ai #nlp
  • 3周前 · ai

    [Paper] 多语言隐藏提示注入攻击对基于LLM的学术评审

    大型语言模型(LLMs)正日益被考虑用于高影响力的工作流程,包括学术同行评审。然而,LLMs 易受到文档……

    #research #paper #ai #machine-learning #nlp
  • 3周前 · ai

    【论文】Web World Models

    语言代理日益需要持久的世界,在其中它们可以行动、记忆和学习。现有方法位于两个极端:传统的网络 fra...

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 3周前 · ai

    [Paper] 端到端 Test-Time Training 用于长上下文

    我们将长上下文语言建模定义为持续学习中的一个问题,而不是架构设计。在这种定义下,我们仅使用标准的 a...

    #research #paper #ai #machine-learning
  • 3周前 · ai

    [Paper] 校准的多层分位数预测

    我们提出了一种在线方法,用于同时保证多个分位水平的分位数预测的校准。α水平的分位数预测序列……

    #research #paper #ai #machine-learning
  • 3周前 · ai

    [Paper] 随机控制微分方程

    我们提出了一种训练高效的时间序列学习框架,将随机特征与受控微分方程(CDE)相结合。在这种方法……

    #research #paper #ai #machine-learning
  • 3周前 · ai

    [Paper] IDT:一种基于物理的 Transformer 用于前馈多视角固有分解

    内在图像分解是视觉理解的基础,因为 RGB 图像将材料属性、光照和视角相关效应交织在一起。Rec...

    #research #paper #ai #computer-vision
  • 3周前 · ai

    [Paper] 少即是多:Probabilistic reduction 最好用 small-scale predictability measures 来解释

    本文的主要研究问题集中在定义在研究关系 b 时所需的或适当的上下文量。

    #research #paper #ai #nlp
  • 3周前 · ai

    [Paper] RoboMirror: 先理解再模仿——从视频到类人机器人行走

    人类通过视觉观察学习运动,先解释视觉内容再模仿动作。然而,state-of-the-art humanoid locomotion sy...

    #research #paper #ai #computer-vision
  • 3周前 · ai

    [Paper] 嵌套浏览器使用学习用于代理式信息寻求

    Information-seeking (IS) agents 已在广泛且深入的搜索任务中取得了强劲表现,但它们的工具使用仍然主要局限于 …

    #research #paper #ai #machine-learning #nlp

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026