EUNO.NEWS EUNO.NEWS
  • All (20349) +286
  • AI (3104) +14
  • DevOps (907) +7
  • Software (10509) +190
  • IT (5781) +75
  • Education (48)
  • Notice
  • All (20349) +286
    • AI (3104) +14
    • DevOps (907) +7
    • Software (10509) +190
    • IT (5781) +75
    • Education (48)
  • Notice
  • All (20349) +286
  • AI (3104) +14
  • DevOps (907) +7
  • Software (10509) +190
  • IT (5781) +75
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 0个月前 · ai

    事实证明,AI 确实可以构建出称职的 Minesweeper 克隆——四个 AI 编码代理接受测试,结果显示 OpenAI 的 Codex 为最佳,而 Google 的 Gemini CLI 为最差

    Ars Technica 选取了当今四个流行的 coding agents,让它们制作一个 Minesweeper 克隆,以看看哪个表现最佳。OpenAI 的 Codex 产生…

    #AI coding agents #OpenAI Codex #Google Gemini #Minesweeper clone #code generation #LLM benchmarking #software automation
  • 1个月前 · ai

    [Paper] DUALGUAGE: 用于安全代码生成的自动化联合安全‑功能基准测试

    大型语言模型(LLMs)和自主编码代理正日益被用于在广泛领域生成软件。然而,一个核心需求仍然……

    #secure code generation #LLM benchmarking #software security #AI research #dual evaluation
EUNO.NEWS
RSS GitHub © 2026