EUNO.NEWS EUNO.NEWS
  • All (19188) +23
  • AI (2997) +1
  • DevOps (879) +1
  • Software (9726) +18
  • IT (5540) +3
  • Education (45)
  • Notice (1)
  • All (19188) +23
    • AI (2997) +1
    • DevOps (879) +1
    • Software (9726) +18
    • IT (5540) +3
    • Education (45)
  • Notice (1)
  • All (19188) +23
  • AI (2997) +1
  • DevOps (879) +1
  • Software (9726) +18
  • IT (5540) +3
  • Education (45)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 1주 전 · ai

    [Paper] Code Generation Benchmarks의 대표성 평가 및 개선: Programming Languages의 Knowledge Units(KUs) 활용 -- Empirical Study

    GPT-4, Claude, LLaMA와 같은 대형 언어 모델(LLMs)은 코드 생성에서 인상적인 성능을 보여주었으며, 일반적으로 벤치마크(예: H…)를 사용하여 평가됩니다.

    #code generation #LLM benchmarks #knowledge units #Python #evaluation methodology
EUNO.NEWS
RSS GitHub © 2026