EUNO.NEWS EUNO.NEWS
  • All (2342) +197
  • AI (544) +17
  • DevOps (139) +1
  • Software (984) +123
  • IT (669) +55
  • Education (5) +1
  • Notice (1)
  • All (2342) +197
    • AI (544) +17
    • DevOps (139) +1
    • Software (984) +123
    • IT (669) +55
    • Education (5) +1
  • Notice (1)
  • All (2342) +197
  • AI (544) +17
  • DevOps (139) +1
  • Software (984) +123
  • IT (669) +55
  • Education (5) +1
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 1주 전 · ai

    [Paper] 검증기 탈출: 시연을 통한 추론 학습

    대형 언어 모델(LLMs)을 추론하도록 훈련하는 것은 종종 작업별 검증자를 이용한 강화 학습(RL)에 의존한다. 그러나 많은 실제 상황의 추론‑...

    #LLM #reinforcement learning #reasoning #research paper
  • 1주 전 · ai

    [Paper] Iterative PPO를 활용한 다중 턴 대화 결과 지향 LLM 정렬

    대규모 언어 모델(LLMs)을 다중 턴 대화 결과에 최적화하는 것은 특히 AI 마케팅과 같은 목표 지향적 환경에서 여전히 큰 과제입니다.

    #LLM #reinforcement learning #PPO #RLHF #goal-oriented dialogue
  • 1주 전 · ai

    [Paper] BAMAS: Budget-Aware 멀티에이전트 시스템 구조화

    대규모 언어 모델(LLM) 기반 다중 에이전트 시스템은 자율 에이전트가 복잡한 작업을 해결하도록 하는 강력한 패러다임으로 부상했습니다. 이러한 시스템은...

    #budget-aware AI #multi-agent systems #LLM cost optimization #integer linear programming #reinforcement learning
EUNO.NEWS
RSS GitHub © 2025