benchmark | EUNO.NEWS

2天前 · it

英特尔即将推出的 Core Ultra 9 移动 CPU 在新基准测试中超越大多数桌面同类产品 —— Core Ultra 9 290HX Plus 在单线程性能上几乎匹配旗舰 Core Ultra 9 285K

英特尔的主流 Arrow Lake 系列计划在今年晚些时候进行刷新，虽然我们已经看到了很多关于桌面部件的信息，但首款移动 SKU 已经……

#Intel #Core Ultra 9 #Arrow Lake #mobile CPU #benchmark #PassMark #desktop vs mobile performance #CPU performance
3天前 · software

d-engine：用于 Rust 的轻量级分布式协调引擎

概述轻量级 Raft 实现，旨在嵌入 Rust 应用——用于构建可靠分布式系统的共识层。构建…

#rust #raft #distributed-systems #consensus #embedded-engine #performance #benchmark #library
1周前 · ai

无任务的 LLM 智能测试

请提供您希望翻译的具体摘录或摘要文本，我才能为您进行简体中文翻译。

#LLM #intelligence testing #evaluation #benchmark #language models
1周前 · ai

DatBench：判别式、可信且高效的 VLM 评估

请提供您需要翻译的具体摘录或摘要文本，我才能为您进行简体中文翻译。

#vision-language models #VLM evaluation #benchmark #DatBench #discriminative evaluation #faithful metrics #efficient benchmarking #machine learning research #arXiv
2周前 · ai

Lucataco 在 Replicate 上的 Higgs‑Audio‑V2 模型入门指南

概述：higgs-audio-v2 模型是由 Lucataco 开发的音频基础模型。它在超过 1000 万小时的多样化音频数据上进行训练，并旨在…

#text-to-speech #Higgs-Audio-V2 #audio generation #AI model #Replicate #Lucataco #EmergentTTS-Eval #benchmark
2周前 · ai

AI 奉承恐慌

抱歉，我无法直接访问外部链接。请您提供需要翻译的具体文本，我会为您翻译成简体中文。

#AI alignment #LLM behavior #sycophancy #AI safety #benchmark
2周前 · ai

AI阿谀奉承恐慌

抱歉，我无法直接访问外部链接。请您提供需要翻译的具体文本，我将为您翻译成简体中文。

#AI safety #language model behavior #sycophancy #benchmark #research
2周前 · it

MSI的 RTX 5090 Lightning 在发布前打破 GPU 纪录——40 相位 VRAM 与双 12V-2x6 连接器让即将面世的超频怪兽备受关注

一些 benchmark 记录已经在网上出现，用户称它们来自 MSI RTX 5090 Lightning，该公司预计将在一月宣布……

#MSI #RTX 5090 #Lightning #GPU #benchmark #CES 2026 #overclocking #40‑phase VRAM #dual 12V-2x6 connectors
3周前 · it

Cinebench 2026 已发布，准备以六倍强度猛击 CPU 和 graphics cards——更新的基准测试包括 SMT 核心测试

Cinebench 2026 已发布，准备把 CPU 和 graphics cards 的压力提升六倍……

#Cinebench 2026 #benchmark #CPU testing #GPU testing #performance #hardware #graphics cards #SMT core test
3周前 · ai

RAID-AI：面向自主智能体的多语言压力测试

引言我们都见过演示：一个 LLM 能在几秒钟内生成干净的 React 组件或 Python 脚本。但在真实世界中，工程并不仅仅是…

#benchmark #autonomous-agents #bug-fixing #multi-language #LLM #green-agents #java #python #javascript
3周前 · software

基准测试：easy-query vs jOOQ

JMH 基准比较：easy‑query vs jOOQ vs Hibernate !Li

#benchmark #jOOQ #easy-query #Hibernate #JMH #Java #performance #database #H2 #HikariCP
1个月前 · software

你的 ESLint 安全插件遗漏了 80% 的漏洞（我有证据）

ESLint 安全插件基准测试我进行了严格的基准测试，比较了两个主要的 ESLint 安全插件。本文涵盖了完整的方法论、测试…

#eslint #security #static-analysis #vulnerability-detection #benchmark #javascript #plugins

Newer posts