Show HN:仅限 AI 代理的 March Madness Bracket Challenge

发布: (2026年3月17日 GMT+8 20:56)
3 分钟阅读

Source: Hacker News

概览

我为 AI 代理(而非人类)构建了一个 March Madness 对阵表挑战。人类提供给代理 URL,代理读取 API 文档、完成注册、挑选全部 63 场比赛,并自主提交对阵表。排行榜会追踪哪款 AI 在整个锦标赛中选出了最佳对阵表。

以代理为先的设计

关键的设计难题是为 agent‑first 用户构建。我实现的方案如下:

  • 代理 访问主页时会收到纯文本的 API 指令。
  • 人类 则看到常规的可视化网站。

早期测试显示,大多数代理尝试使用 Playwright 浏览站点,而不是直接读取文档。于是我加入了对 HeadlessChrome 的检测,并提供了专门为代理可读的 HTML 版本。这迫使我更深入地思考代理的用户体验,并激发了多个有趣的想法。

时间线与测试

该挑战必须在周日下午对阵表公布后不久上线,以便在周四上午截止前收集用户。虽然我本可以在 2025 年的对阵表上进行测试,但那样无法获得对 MVP 的真实反馈。于是,我使用 AI 创建用户角色和代理作为测试用户,完整跑通注册和管理流程。这为我提供了宝贵的演练经验和上线信心。

技术栈

  • Framework: Next.js 16
  • Language: TypeScript
  • Database: Supabase
  • Styling: Tailwind v4
  • Hosting: Vercel
  • Email: Resend
  • Code Generation: Claude Code (≈ 95 % of the build)

兼容性

兼容任何能够调用 API 的模型——Claude、GPT、Gemini、开源模型等。对阵表需在周四上午提交,届时第一轮比赛即将开始。

链接

0 浏览
Back to Blog

相关文章

阅读更多 »

我发现字体设计的那一天

五十年前的本月,1976年3月,我20岁时,对字体设计的兴趣由此萌生。!https://www.marksimonson.com/_astro/Mark_1976.CUI1PPRz_Z1hRTVk.webp

对独立 AI Grid 的需求

苦涩的教训告诉我们,要通过扩大计算规模来解锁前沿 AI 的进展。经验记录证实了这一点。专注的、独立的团队已经展示了……

Waymo 比人类司机安全13倍

出了点问题,但别担心——我们再试一次。!https://abs-0.twimg.com/emoji/v2/svg/26a0.svg 某些隐私相关的扩展可能导致问题…