Claude、Microsoft Copilot 再次未能预测肯塔基德比冠军
Source: Slashdot
肯塔基德比的 AI 预测
在 2016 年,一个在线的“群体智能”平台通过按顺序命名四名前列马匹,正确预测了肯塔基德比(它在 2017 年的预测则大相径庭)。Slashdot 重新审视了 2023‑2025 年现代 AI 系统的表现,结果仍然令人失望。问题仍在:2026 年的 AI 生成的德比预测会更好吗?
2026 年的冠军是 24 比 1 的冷门 Golden Tempo,而许多博彩公司更看好最终排名第 11 的 Further Ado。当 USA Today 让 Microsoft Copilot 给出自己的预测时,Copilot 也选了 Further Ado 为冠军,并把 Golden Tempo 排在第 13 位。
Microsoft Copilot 的预测 vs. 实际结果
| 马匹(Copilot 选取) | 实际名次 |
|---|---|
| Further Ado | 11th |
| Chief Wallabee | 4th |
| The Puma (SCRATCHED) | — |
| Renegade | 2nd |
| Commandment | 7th |
| So Happy | 9th |
| Emerging Market | 10th |
| Danon Bourbon | 5th |
| Potente | 12th |
| Incredibolt | 6th |
| Robusta | 14th |
| Ocelli | 3rd |
| Golden Tempo | 1st |
| Pavlovian | 18th |
| Great White (SCRATCHED) | — |
| Wonder Dean | 8th |
| Litmus Test | 17th |
| Albus | 15th |
| Six Speed | 13th |
| Intrepido | 16th |
根据 USA Today 的要求,Copilot 使用了最新的赔率、赛道状况以及对热门马匹、最佳投注、专家选拔、历史成绩、赛道历史和起跑位置的分析。
Claude 的预测 vs. 实际结果
Yahoo Sports 让 Claude “使用开盘赔率、抽签和潜在赛道条件模拟比赛”,并加入了人类预测的因素。和 Copilot 一样,Claude 也选了 Further Ado 为冠军(实际第 11 名),并把 Golden Tempo 排在第 12 位。
| 马匹(Claude 选取) | 实际名次 |
|---|---|
| Further Ado | 11th |
| The Puma (SCRATCHED) | — |
| Commandment | 7th |
| Chief Wallabee | 4th |
| Renegade | 2nd |
| Emerging Market | 10th |
| So Happy | 9th |
| Incredibolt | 6th |
| Danon Bourbon | 5th |
| Potente | 12th |
| Pavlovian | 18th |
| Golden Tempo | 1st |
| Litmus Test | 17th |
| Albus | 15th |
| Wonder Dean | 8th |
| Six Speed | 13th |
| Intrepido | 16th |
结论
Microsoft Copilot 与 Claude 都未能识别出实际冠军,而是倾向于被大量投注的马匹 Further Ado。它们的预测把最终冠军 Golden Tempo 排在远离前列的位置,凸显了 AI 在准确预测赛马结果方面的当前局限性。
完整故事见 Slashdot.