EUNO.NEWS EUNO.NEWS
  • All (2671) +392
  • AI (581) +28
  • DevOps (154) +9
  • Software (1110) +207
  • IT (820) +147
  • Education (6) +1
  • Notice
  • All (2671) +392
    • AI (581) +28
    • DevOps (154) +9
    • Software (1110) +207
    • IT (820) +147
    • Education (6) +1
  • Notice
  • All (2671) +392
  • AI (581) +28
  • DevOps (154) +9
  • Software (1110) +207
  • IT (820) +147
  • Education (6) +1
  • Notice
Sources Tags Search
한국어 English 中文
  • 4天前 · ai

    [Paper] RoaD:将 Rollouts 视为 Demonstrations 用于闭环监督微调自动驾驶策略

    自动驾驶策略通常通过 open-loop behavior cloning 对人类示范进行训练。然而,这类策略在协变量偏移时会受到影响。

    #research #paper #ai #machine-learning #computer-vision
  • 4天前 · ai

    [Paper] LLM CHESS:通过国际象棋对LLM的推理和指令遵循进行基准测试

    我们介绍了 LLM CHESS,一个旨在探究大型语言模型在推理和遵循指令能力上的泛化性的评估框架(...)。

    #research #paper #ai #machine-learning #nlp
  • 4天前 · ai

    [Paper] 非平稳环境中的离线强化学习预测

    离线强化学习(RL)在从预先收集的数据集训练策略时提供了一条有前景的途径,尤其是在获取额外交互数据困难的情况下……

    #research #paper #ai #machine-learning
  • 4天前 · ai

    [Paper] 一种稳健且可推广的设备无关深度学习模型,用于基于三轴腕部加速度计的睡眠-觉醒判定

    研究目的:腕部加速度计被广泛用于推断睡眠-清醒状态。先前的研究显示,唤醒检测效果不佳,且缺乏跨设备的通用性。

    #research #paper #ai #machine-learning
  • 4天前 · ai

    [Paper] 基于特征的语义感知调度用于能量采集联邦学习

    在资源受限的边缘设备上进行联邦学习(FL)面临一个关键挑战:训练深度神经网络(DNN)所需的计算能量……

    #research #paper #ai #machine-learning
  • 4天前 · ai

    [Paper] Chain-of-Ground:通过迭代推理和参考反馈提升 GUI Grounding

    GUI grounding 旨在将自然语言指令与复杂用户界面中的精确区域对齐。先进的多模态大型语言模型表现出强大的……

    #research #paper #ai #machine-learning #nlp #computer-vision
  • 4天前 · ai

    [Paper] AI驱动的在不确定性下的矿物加工作业优化

    全球矿物加工能力必须快速扩张,以满足关键矿产的需求,这些矿产对构建清洁能源技术至关重要。

    #research #paper #ai #machine-learning
  • 4天前 · ai

    [Paper] 从原子到复合:强化学习实现互补推理的泛化

    RL 对推理能力的贡献机制——是激励新技能的综合,还是仅仅放大已有行为——仍然...

    #research #paper #ai #machine-learning #nlp
  • 4天前 · ai

    [Paper] 我们离真正有用的 Deep Research Agents 还有多远?

    深度研究代理(DRAs)旨在通过迭代的信息检索与综合,自动生成分析师级报告。然而,大多数现有的 DRA……

    #research #paper #ai #nlp
  • 4天前 · ai

    [Paper] 主体策略优化 via 指令-策略协同进化

    可验证奖励的强化学习(RLVR)提升了大型语言模型(LLMs)的推理能力,使得自主代理能够……

    #research #paper #ai #machine-learning #nlp
  • 4天前 · ai

    [Paper] AI代理框架中代理开发者实践的实证研究

    大型语言模型(LLMs)的崛起引发了对代理的浓厚兴趣,导致代理框架的快速增长。代理框架是软件……

    #research #paper #ai #machine-learning
  • 4天前 · ai

    [Paper] 从优化的视角纠正 LLM 思考

    近期大型语言模型(LLMs)的进展主要得益于其新兴的推理能力,尤其是通过长链式思考(CoT)……

    #research #paper #ai #machine-learning #nlp

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2025