Anthropic Skills. 新模型和架构的全景

发布: (2025年12月15日 GMT+8 16:50)
5 min read
原文: Dev.to

Source: Dev.to

Cover image for Anthropic Skills. The Landscape for New Models and Architecture

引言

Skills 是模块化、按需加载的数据,能够把通用 LLM 转变为专用代理。这并不是关于 MCP 或花哨的协议——而是关于 上下文工程:在恰当的时机加载恰当的信息。

Skill 是一种记忆、指令、事实或代码片段,按需加载到你的 LLM 的上下文窗口中。
Skill 也是 RAG + System Instructions + Domain Expertise 的组合。

你可以用技能实现的所有功能,技术上也可以不使用技能而实现:把大量 token(工具、指令、示例)加载进上下文,使用一个思考时间足够长的大推理模型,就能得到尚可的结果。然而,基于技能的新方法更简单、更快、更便宜,也更具可扩展性。

这并不是关于 MCP

我写代码已有 14 年,密切关注 AI 动向,自认是个 vibe‑coder。大约一年前,我分享了我从 开发者视角 对 MCP 的看法:关于 MCP 的开发者思考

我的核心论点: MCP 作为一种方法和编程模式未必是最佳解决方案。

  • 我不使用 MCP 服务器,因为它们在我的使用场景下表现不佳。
  • 编码代理已经足够:终端命令、文件系统、网页搜索能够处理大多数情形。
  • 当代理必须调用外部工具(例如创建 Google Calendar 事件)时,我需要更稳健的自定义代码,而不是 MCP 包装器。
  • 我的调试工作流:手动添加 3‑4 个文件 + 1‑2 个文档链接。这比任何自动化上下文检索都更有效。

这些文件和链接本可以自动发现——这正是技能所承诺的:让代理更聪明。

上下文工程

我感觉架构正在发生转变:

  • 之前: 大型通用预训练模型 微调模型。
  • 之后: 小型推理模型搭配新架构进行学习 + Skills 解决任务特定问题。

“上下文工程是用恰当的信息填充上下文窗口,以完成下一步的精细艺术与科学。” — Andrej Karpathy

关键洞见:这不是拥有最大的模型,而是拥有 在正确时刻的正确上下文

前进的路径

这仍然是研发阶段——是主流 LLM 开发的一个分支,而非替代品。Anthropic 已经在这上面工作了 6 个月以上,我们是早期采用者,在主流到来之前探索更好的方向。我的预测是:六个月后,所有人都会涌向基于技能的代理架构。

我们需要:

  • 自动化技能发现。
  • 可组合的技能库——将技能组合用于复杂的多步骤工作流(例如 n8n)。
  • 行业特定的技能包——为常见开发者任务预构建的专业知识,如 Angular 技能或 GitHub Runner 技能。

结论

Skills 体现了一种模块化、可复用、按需提供的专业知识哲学,能够把任何 LLM 转变为特定工作流的专用代理。我相信这是一条正确的道路,并计划密切关注其进展,最终编写利用或扩展 Skills 的新项目。

Back to Blog

相关文章

阅读更多 »

为你的LLMs设立护栏

!Forem 标志 https://media2.dev.to/dynamic/image/width=65,height=,fit=scale-down,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%...