EUNO.NEWS EUNO.NEWS
  • All (2421) +244
  • AI (552) +20
  • DevOps (144) +3
  • Software (1016) +139
  • IT (704) +81
  • Education (5) +1
  • Notice
  • All (2421) +244
    • AI (552) +20
    • DevOps (144) +3
    • Software (1016) +139
    • IT (704) +81
    • Education (5) +1
  • Notice
  • All (2421) +244
  • AI (552) +20
  • DevOps (144) +3
  • Software (1016) +139
  • IT (704) +81
  • Education (5) +1
  • Notice
Sources Tags Search
한국어 English 中文
  • 3天前 · ai

    [Paper] 从原子到复合:强化学习实现互补推理的泛化

    RL 对推理能力的贡献机制——是激励新技能的综合,还是仅仅放大已有行为——仍然...

    #research #paper #ai #machine-learning #nlp
  • 3天前 · ai

    [Paper] 我们离真正有用的 Deep Research Agents 还有多远?

    深度研究代理(DRAs)旨在通过迭代的信息检索与综合,自动生成分析师级报告。然而,大多数现有的 DRA……

    #research #paper #ai #nlp
  • 3天前 · ai

    [Paper] 主体策略优化 via 指令-策略协同进化

    可验证奖励的强化学习(RLVR)提升了大型语言模型(LLMs)的推理能力,使得自主代理能够……

    #research #paper #ai #machine-learning #nlp
  • 3天前 · ai

    [Paper] 从优化的视角纠正 LLM 思考

    近期大型语言模型(LLMs)的进展主要得益于其新兴的推理能力,尤其是通过长链式思考(CoT)……

    #research #paper #ai #machine-learning #nlp
  • 3天前 · ai

    [Paper] 潜在辩论:用于解释 LLM 思维的代理框架

    理解大型语言模型(LLMs)的内部思考过程以及幻觉产生的原因仍然是一个关键挑战。为此,我们引入了 l...

    #research #paper #ai #nlp
  • 4天前 · ai

    [Paper] MEGConformer: 基于Conformer的MEG解码器用于鲁棒的语音和音素分类

    我们提出基于Conformer的解码器用于LibriBrain 2025 PNPL竞赛,针对两个基础的MEG任务:Speech Detection 和 Phoneme Classification……

    #research #paper #ai #machine-learning #nlp
  • 4天前 · ai

    [Paper] BackportBench:用于自动回移补丁的多语言基准

    许多现代软件项目发展迅速,以纳入新功能和安全补丁。用户将其依赖项更新到更安全的版本非常重要。

    #research #paper #ai #nlp
  • 4天前 · ai

    [Paper] 测试机器意识假设

    Machine Consciousness Hypothesis 认为,意识是一种与基底无关的功能属性,存在于能够进行二阶感知的计算系统中……

    #research #paper #ai #machine-learning #nlp
  • 6天前 · ai

    [Paper] ThetaEvolve:测试时学习在开放问题上

    近期在大型语言模型(LLMs)方面的进展已经促成了数学发现的突破,以 AlphaEvolve 为例,这是一个闭源系统,...

    #research #paper #ai #machine-learning #nlp
  • 6天前 · ai

    [Paper] MegaChat:合成波斯语问答数据集用于高质量销售聊天机器人评估

    伊朗的中小企业(SMEs)日益利用Telegram进行销售,实时互动对转化至关重要。然而,dev...

    #research #paper #ai #machine-learning #nlp
  • 6天前 · ai

    [Paper] 歧义感知优化:面向 Direct Preference Optimization 的语义消歧

    Direct Preference Optimization(DPO)是一种在各个领域广泛使用的基于人类反馈的强化学习(RLHF)方法。最近的研究已经…

    #research #paper #ai #nlp
  • 6天前 · ai

    [Paper] 被动基于专长的个性化足够吗?AI辅助考试的案例研究

    新手用户和专家用户在任务导向对话中有不同的系统性偏好。然而,迎合这些偏好是否真的能提升用户……

    #research #paper #ai #nlp

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2025