EUNO.NEWS EUNO.NEWS
  • All (19484) +61
  • AI (3018) +2
  • DevOps (886) +2
  • Software (9926) +51
  • IT (5606) +6
  • Education (48)
  • Notice
  • All (19484) +61
    • AI (3018) +2
    • DevOps (886) +2
    • Software (9926) +51
    • IT (5606) +6
    • Education (48)
  • Notice
  • All (19484) +61
  • AI (3018) +2
  • DevOps (886) +2
  • Software (9926) +51
  • IT (5606) +6
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 1周前 · ai

    [Paper] 评估并改进代码生成基准的代表性:使用编程语言的知识单元(KUs)——实证研究

    大型语言模型(LLMs),如 GPT-4、Claude 和 LLaMA,在代码生成方面表现出色,通常使用基准测试(例如 H…)进行评估。

    #code generation #LLM benchmarks #knowledge units #Python #evaluation methodology
EUNO.NEWS
RSS GitHub © 2026