SmartKNN 回归基准 高维数据集

发布: (2025年12月29日 GMT+8 14:58)
3 min read
原文: Dev.to

Source: Dev.to

概览

本次发布提供了 SmartKNN 在大维度数据集上的初步回归基准,重点评估单次预测的 p95 延迟和在真实生产约束下的 R²。所有基准均为:

  • 仅 CPU
  • 单查询推理
  • 非参数、非线性模型
  • 大规模数据集

更高维度数据集、分类任务、混合特征空间等额外基准将在近期发布。


数据集

数据集OpenML ID大约行数特征 (D)任务来源
Buzzinsocialmedia_Twitter4549466,60077回归OpenML
Allstate_Claims_Severity44045150,654124回归OpenML
College Scorecard4667499,759118回归OpenML

基准结果

Buzzinsocialmedia_Twitter

模型RMSE ↓R² ↑训练时间 (秒)批处理 (毫秒)单次中位数 (毫秒)单次 p95 (毫秒)
XGBoost254.430.827422.210.0050.2280.280
LightGBM214.790.877025.670.0080.5110.650
CatBoost231.430.857239.530.0000.8091.021
SmartKNN (wt=0.0)167.150.9255214.390.0600.3830.561

Allstate_Claims_Severity

模型RMSE ↓R² ↑训练时间 (秒)批处理 (毫秒)单次中位数 (毫秒)单次 p95 (毫秒)
XGBoost0.53550.560411.200.0050.2110.272
LightGBM0.53560.56038.400.0200.5110.630
CatBoost0.54080.551622.840.0431.0351.308
SmartKNN (wt=0.0)0.62190.407151.510.0620.3050.366

College Scorecard

模型RMSE ↓R² ↑训练时间 (秒)批处理 (毫秒)单次中位数 (毫秒)单次 p95 (毫秒)
XGBoost0.18550.69358.360.0060.2370.329
LightGBM0.18640.69055.770.0100.5050.635
CatBoost0.19460.662614.250.0010.8790.950
SmartKNN (wt=0.0)0.23000.529027.310.0540.2480.286

关键发现

  • SmartKNN 在 CPU 上的单次 p95 延迟表现出竞争力,尤其在 Buzzinsocialmedia_Twitter 数据集上,既在延迟上优于基于树的基线,又实现了最高的 R²。
  • 基于树的模型(XGBoost、LightGBM、CatBoost)通常提供更好的准确性和更低的平均延迟,但 SmartKNN 缩小了尾部延迟差距,这在生产系统中往往是最关键的因素。
  • 所有结果均可使用公开的 OpenML 数据集复现。

社区参与

我们鼓励社区:

  • 在不同硬件上运行这些基准
  • 测试其他 ANN 配置
  • 与更多模型进行比较
  • 公开分享结果

如果发现性能回退,请打开 GitHub Issue。如有问题、想法或改进,请发起 GitHub Discussion。新的基准结果也可以以 Issue 或 Discussion 形式发布。

资源

Back to Blog

相关文章

阅读更多 »

AI 正在重塑医疗保健诊断

当大多数人想到去看医生时,他们会想到候诊室、血液检查、扫描以及大量的焦虑。然而,常常看不见的,是 e...