EUNO.NEWS EUNO.NEWS
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
  • All (20543) +144
    • AI (3117) +9
    • DevOps (914) +5
    • Software (10652) +105
    • IT (5812) +25
    • Education (48)
  • Notice
  • All (20543) +144
  • AI (3117) +9
  • DevOps (914) +5
  • Software (10652) +105
  • IT (5812) +25
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 2周前 · ai

    使用 NeMo Agent Toolkit 简化生产就绪的 LLM

    从简单聊天到多代理推理和实时 REST API。文章《Production-Ready LLMs Made Simple with the NeMo Agent Toolkit》首次出现在 Towar…

    #LLM #NeMo #agent toolkit #production AI #NVIDIA #deep learning #NLP #AI deployment #multi‑agent reasoning
  • 3周前 · ai

    [Paper] 使用 Rubric Rewards 训练 AI 合科学家

    AI co-scientists 正在成为帮助人类研究人员实现研究目标的工具。这些 AI co-scientists 的一个关键特性是其能力……

    #research #paper #ai #machine-learning #nlp
  • 3周前 · ai

    [论文] 在多轮对话中引发行为

    在对话环境中识别大型语言模型(LLMs)的特定且往往复杂的行为对于其评估至关重要。近期工作提出…

    #research #paper #ai #machine-learning #nlp
  • 3周前 · ai

    [Paper] 用细粒度人类反馈对文本片段微调 LLMs

    我们提出了一种方法和数据集,用于在偏好监督下通过反馈驱动的改进链对语言模型进行微调。给定模型的响应,……

    #research #paper #ai #nlp
  • 3周前 · ai

    [Paper] PROFASR-BENCH:针对高风险专业语音的上下文条件化 ASR 基准

    在专业环境中的自动语音识别(ASR)面临着现有基准低估的挑战:密集的领域术语、正式语体的变体……

    #research #paper #ai #nlp
  • 3周前 · ai

    [Paper] 多语言隐藏提示注入攻击对基于LLM的学术评审

    大型语言模型(LLMs)正日益被考虑用于高影响力的工作流程,包括学术同行评审。然而,LLMs 易受到文档……

    #research #paper #ai #machine-learning #nlp
  • 3周前 · ai

    【论文】Web World Models

    语言代理日益需要持久的世界,在其中它们可以行动、记忆和学习。现有方法位于两个极端:传统的网络 fra...

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 3周前 · ai

    [Paper] 少即是多:Probabilistic reduction 最好用 small-scale predictability measures 来解释

    本文的主要研究问题集中在定义在研究关系 b 时所需的或适当的上下文量。

    #research #paper #ai #nlp
  • 3周前 · ai

    [Paper] 嵌套浏览器使用学习用于代理式信息寻求

    Information-seeking (IS) agents 已在广泛且深入的搜索任务中取得了强劲表现,但它们的工具使用仍然主要局限于 …

    #research #paper #ai #machine-learning #nlp
  • 3周前 · ai

    [Paper] 消费者健康护理问题摘要的数据集与基准

    对健康信息的追求已经让网络充斥着消费者的健康相关问题。一般来说,消费者使用过于描述性和外围的……

    #research #paper #ai #nlp
  • 3周前 · ai

    [Paper] 闭环:通过多智能体角色扮演合成无限工具使用数据

    让大型语言模型(LLMs)可靠地调用外部工具仍然是自主代理的关键瓶颈。现有方法在 thr...

    #research #paper #ai #nlp
  • 3周前 · ai

    [Paper] CubeBench: 诊断交互式、长时程空间推理在部分观测下

    大型语言模型(LLM)代理虽然在数字领域表现出色,但由于在形成……方面的挑战,它们在物理世界部署方面存在显著差距。

    #research #paper #ai #machine-learning #nlp #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026