EUNO.NEWS EUNO.NEWS
  • All (2352) +197
  • AI (546) +17
  • DevOps (141) +1
  • Software (988) +123
  • IT (672) +55
  • Education (5) +1
  • Notice
  • All (2352) +197
    • AI (546) +17
    • DevOps (141) +1
    • Software (988) +123
    • IT (672) +55
    • Education (5) +1
  • Notice
  • All (2352) +197
  • AI (546) +17
  • DevOps (141) +1
  • Software (988) +123
  • IT (672) +55
  • Education (5) +1
  • Notice
Sources Tags Search
한국어 English 中文
  • 1周前 · ai

    [Paper] 逃离验证器:通过示例学习推理

    训练大型语言模型(LLMs)进行推理通常依赖于带有任务特定验证器的强化学习(RL)。然而,许多现实世界的推理‑

    #LLM #reinforcement learning #reasoning #research paper
  • 1周前 · ai

    [Paper] 超越 URL:元数据多样性与位置用于高效 LLM 预训练

    在大型语言模型(LLMs)预训练中加入metadata最近被视为一种加速训练的有前景的方法。然而,以前的工作强调……

    #LLM pretraining #metadata #training efficiency #research paper #large language models
  • 1周前 · ai

    [论文] 控制对注意力 logits 的更改

    在训练 transformer 模型时,神经网络权重的稳定性至关重要。查询(query)和键(key)权重尤其成问题,因为它们倾向于增长……

    #attention #transformer training #learning rate scaling #model stability #research paper
  • 1周前 · ai

    [Paper] Agint:Agentic Graph Compilation for 软件工程代理

    基于LLM的编码代理正变得越来越普遍,但仍面临上下文管理、延迟、可靠性、可重复性和可扩展性方面的挑战。我们预…

    #agentic AI #LLM coding assistants #graph compilation #software engineering automation #research paper
EUNO.NEWS
RSS GitHub © 2025