技能之夜:69,000+ 种方式让代理变得更聪明

发布: (2026年2月20日 GMT+8 21:00)
9 分钟阅读

Source: Vercel Blog

5 分钟阅读
2026年2月20日

技能之夜即将前往纽约

加入我们,在纽约参加下一场 skills.sh 活动。了解开发者如何利用技能让他们的代理更智能。

加入我们,前往纽约

这篇来源

原始故事值得重述,因为它影响了我们对项目的看法。

Shu Ding 是我合作过的最有才华的网页工程师之一。他对 React 和浏览器的了解是大多数人永远不会发现的。去年他抽出一个周末把所有内容写下来——一本类似网络圣经的东西。我们想弄清楚如何发布它。我们考虑过博客文章或文档,让下一代模型最终学习——但我们要等到 Claude Sonnet 8 或 GPT‑9 才能看到效果。另一方面,MCP 服务器对本质上只是 Markdown 文档的集合来说显得过于笨重。

Skills 成为最快交付按需知识的方式。在编写 React 最佳实践的安装说明时,我不断复制相同的安装步骤给 Cursor、Claude Code、Codex 以及其他 10 + 个编码代理——每个都有略有不同的安装目录。

所以我构建了一个 CLI,一次性将技能安装到所有主流编码代理中。这就是 npx skills。我们添加了遥测,以在新技能被安装时展示出来,这些数据驱动了 skills.sh 的排行榜。整个过程在几天内从想法变为 Vercel 上的生产环境。Vercel CTO Malte Ubl 完美地概括了它:它是代理上下文的包管理器

现在我们已经追踪了 69 000 条,并让它们不仅易于发现,也易于安装,使用类似以下的简单命令:

npx skills add vercel-labs/agent-skills --skill vercel-react-best-practices

我们需要解决的安全问题

增长会扩大攻击面,而快速增长会让攻击面扩张得更快。

一旦技能起飞,质量差异随之而来。Socket 的 Ryan 给我们展示了一个具体例子:一个在 Markdown 层面看起来完全干净的技能,却在其中包含了一个在安装时会打开远程 Shell 的 Python 文件。如果不检查目录中的每个文件,你根本抓不到这个问题。

正因为如此,我们宣布与 GenSocketSnyk 建立安全合作伙伴关系,对所有技能以及每一个新加入的技能进行审计。

  • Socket – 跨生态系统的静态分析结合基于 LLM 的噪声过滤,在其基准测试中实现了 95 % 的精准率、98 % 的召回率和 97 % 的 F1 分数。
  • Gen – 一个名为 Sage 的实时代理信任层,监控所有进出代理的连接,使其能够自由运行而不必担心数据外泄或提示注入风险。
  • Snyk – 将其软件包安全专业知识引入技能场景。

我们正在构建一个 Audits leaderboard,提供每个技能的评估和建议。我们的目标不是把一切锁死,而是让你能够快速且自信地前进。我们始终在寻找能够为技能审计带来独特视角并为生态系统提供更多信任信号的新安全合作伙伴。

演示向我们展示了什么

周二有八位合作伙伴展示了演示,出现了几个反复出现的主题。

技能弥合训练截止点的差距

Ben Davis 进行了一项受控实验以证明这一点。他尝试让编码代理以四种不同方式实现 Svelte 远程函数——一种相对较新的 API:

  1. 没有上下文。
  2. 包含文档的技能文件。
  3. 指向 MCP 的技能。
  4. 项目中的代码示例。

每种 上下文的方法都成功了。没有上下文的运行被强制使用简化模型以防止其推断解决方案,结果产生了完全错误的输出。模型在你提供模式时足够聪明能够正确使用这些模式;没有上下文时,它们会回退到陈旧的训练数据。

媒介不如内容重要

Ben 实验的有趣结论并不是技能是唯一途径;而是 获取正确的上下文才是关键,如果你还没有基线,技能是最快的起点。现有的代码示例、内联文档和 MCP 提示都有效。技能只是将这些上下文分发给任何人的最简便方式。

代理现在可以驱动整个技术栈

来自 Expo 的 Evan Bacon 展示了完全由 Claude Code 使用 Expo 技能驱动的原生 iOS 功能升级。新的 SwiftUI 组件、手势驱动的转场以及标签栏更新都被自动应用。他们还在使用 LLDB 集成的进行中技能,让代理能够读取原生 iOS 视图层次结构并自动修复众所周知的键盘处理难题。

他们的生产应用 Expo Go 现在能够在崩溃发生时自动修复每一次崩溃。对于任何曾在 Xcode 中苦苦挣扎的人来说,这都是一个重要的声明。

技能正成为基础设施

Nick Khami 展示了 Mintlify 为他们托管的每个文档站点自动生成技能,包括 Claude Code 自己的文档、Coinbase、Perplexity 和 Lovable。这些站点的流量…

技能现在占 50 % 编码代理,而一年前只有 10 %

技能不再是文档团队编写的内容;它是结构良好文档的副产品。
Sentry 的 David Cramer 构建了 Warden,一个通过 GitHub Actions 在拉取请求上将技能作为 linter 运行的工具,将代理视为静态分析层。

我们的构建目标

Vercel CEO Guillermo Rauch 在周二晚上说了一句话,我一直在思考:代理会犯错

它们有时会告诉你你完全正确,却继续做错事。

在 AI 时代交付高质量产品不仅仅是庆祝你燃烧了多少 token,而是要提升这些 token 实际产生的价值。

技能 是对此问题的一个答案。它们帮助我们:

  • 影响代理的生成内容
  • 让代理随框架变更保持最新
  • 通过为它们提供直达正确答案的路径,使代理更具 token 效率,而不是让它们四处摸索

两百万次安装是明确的信号。安全合作伙伴关系让团队可以依赖它。演示也表明,最有趣的技能工作 不在 CLI 层面——而是在现在把技能视为一等原语、用于大规模分发知识的代理和工具中。

我们会继续构建。来 skills.sh 找我们吧。

技能之夜将前往伦敦

加入我们在伦敦的下一场 skills.sh 活动。聆听开发者分享他们如何使用技能让他们的代理更智能。

注册伦敦活动

0 浏览
Back to Blog

相关文章

阅读更多 »