EUNO.NEWS EUNO.NEWS
  • All (2379) +221
  • AI (548) +19
  • DevOps (142) +2
  • Software (998) +131
  • IT (686) +68
  • Education (5) +1
  • Notice
  • All (2379) +221
    • AI (548) +19
    • DevOps (142) +2
    • Software (998) +131
    • IT (686) +68
    • Education (5) +1
  • Notice
  • All (2379) +221
  • AI (548) +19
  • DevOps (142) +2
  • Software (998) +131
  • IT (686) +68
  • Education (5) +1
  • Notice
Sources Tags Search
한국어 English 中文
  • 1天前 · ai

    Gemini 3 Pro 在盲测中获得 69% 的信任度,较 Gemini 2.5 的 16% 提升:评估 AI 的真实世界信任而非学术基准的必要性

    就在几周前,Google 推出了 Gemini 3 模型,声称它在多个 AI 基准中取得了领先地位。但供应商面临的挑战是……

    #Gemini 3 #trustworthiness #AI evaluation #benchmarking #large language models #Google AI #Prolific study
  • 2天前 · software

    100k TPS 超过十亿行:SQLite 的惊人高效性

    抱歉,我无法直接访问外部链接。请您提供需要翻译的摘录或摘要文本,我会为您翻译成简体中文。

    #SQLite #database performance #high throughput #benchmarking #SQL #embedded databases #scalability
  • 3天前 · software

    大负载的 JSON 解析:在速度、内存和可扩展性之间取得平衡

    针对大规模负载的 JSON 库基准测试 这篇文章《JSON Parsing for Large Payloads: Balancing Speed, Memory, and Scalability》首次出现在 Towards Data…

    #JSON #parsing #performance #benchmarking #large payloads #speed #memory usage #scalability #libraries
  • 3天前 · software

    理解 Qeltrix V1 PoC 性能:背景与局限

    关键背景:这到底是什么 PoC 这是一种最基础层面的 Proof‑of‑Concept。 它不是前期开发,也不是原型,更不是 alpha 版软件……

    #Qeltrix #proof-of-concept #performance #Python #benchmarking #optimization #validation
  • 1周前 · ai

    [Paper] 深度伪造检测器的通用设计选择

    深度伪造检测方法的有效性往往不太取决于其核心设计,而更取决于实现细节,例如数据预处理、增强……

    #deepfake detection #computer vision #benchmarking #model optimization
  • 1周前 · ai

    [Paper] 大型语言模型中模型合并技术的系统研究

    模型合并将多个 fine-tuned checkpoints 合并为单一模型,无需额外训练,提供了一种重新使用模型并提升效率的有吸引力的方法。

    #model merging #large language models #task arithmetic #LLM research #benchmarking
EUNO.NEWS
RSS GitHub © 2025