10个 AI 术语,帮助你看起来不像完全迷失

发布: (2025年12月29日 GMT+8 21:15)
11 min read
原文: Dev.to

It looks like the text you’d like translated isn’t included in your message. Could you please paste the content you want translated (keeping the source line at the top), and I’ll provide the Simplified Chinese version while preserving the formatting?

狗年

一年在人类世界的大致相当于 五年,当涉及到 AI 相关技术时。如果你在几年前的项目中开始使用基于 AI 的工具,那么很可能你依赖的技术现在已经完全过时。新工具和新范式每天都在出现,抛下那些几个月前还被视为革命性的概念。

在这个行业保持领先是必须的。众所周知,你需要一只眼睛盯着你正在使用的技术栈的最新更新,另一只眼睛关注正在 gaining traction 的新技术,否则就会被淘汰。但即使是我们这些仅仅想在软件行业谋生——并支付流媒体订阅费——的人,这种节奏也让人头晕目眩。

正因为如此,我尝试整理了一份简短的术语列表,如果你和我一样有一种列车已经开走而你还在站台上的感觉(讽刺的是,这份列表很可能在你读完之前就已经过时),它可能会对你有所帮助。

1. Agentic AI

What it is not: an AI agent is not a chatbot. A chatbot responds to a prompt and stops there.

What it is: an agent operates more autonomously. It can:

  1. Receive information from its environment (inputs, state, APIs)
  2. Reason about that information
  3. Decide which action to take
  4. Execute the action
  5. Observe the outcome and, if necessary, repeat the cycle

This perceive → reason → act → observe loop, together with some degree of memory and tool usage, is what differentiates an agent from a simple conversation with a language model. The approach can be applied to almost any programmatically definable context—from travel‑agency workflows to data analysis or DevOps engineering tasks.

1. 主体 AI

它不是: AI 代理 不是 聊天机器人。聊天机器人只会对提示作出回应,然后结束。

它是: 代理具有更高的自主性。它可以:

  1. 从其环境中获取信息(输入、状态、API)
  2. 对这些信息进行推理
  3. 决定采取哪种行动
  4. 执行该行动
  5. 观察结果,并在必要时重复上述循环

这种 感知 → 推理 → 行动 → 观察 循环,加上一定程度的记忆和工具使用,使得代理区别于仅仅与语言模型进行的简单对话。该方法几乎可以应用于任何可程序化定义的场景——从旅行社工作流到数据分析或 DevOps 工程任务。

2. 大型推理模型 (LRM)

在大多数商业聊天机器人中,主要优先级是提供快速响应。这对简单任务效果很好,但随着问题变得更复杂,通常需要多次迭代才能得到满意的结果。

当系统生成响应的时间变长时,用户通常会看到熟悉的“思考中…”提示。这并不意味着使用了不同的模型;而是模型正在生成更长的输出或进行更复杂的内部推理过程。

大型推理模型 是经过更好调优的模型,能够:

  • 将问题拆分为中间步骤
  • 在推理过程中保持连贯性
  • 处理需要规划的任务

无论这种行为是模型自身产生的,还是由外部逻辑支持的,它正是 AI 代理有效运行所需要的。

Source:

3. 向量数据库

即使对 LLM 的内部工作原理没有深入了解,也很容易看出真正的挑战并不是存储数据——传统数据库在这方面仍然完全足够——而是能够 按意义搜索和关联信息,而不仅仅是精确匹配。

嵌入模型

嵌入模型将文本、图像或音频等数据转换为数值向量。这些向量是捕捉不同数据片段之间相似关系的数学表示。

什么是向量?

向量是嵌入模型生成的数值表示。它使我们能够执行数学运算,以寻找“相近”的向量,这相当于在语义上相似的内容之间进行搜索和处理。

向量数据库的工作原理:

  • 在传统数据库中,图像被存储为 BLOB(二进制大对象)。数据库可以检索 BLOB,但对其内容一无所知。
  • 在向量数据库中,同一图像会通过嵌入模型处理,生成数值向量。
  • 这些向量占据高维空间,维度隐式编码概念(例如 “风景”、 “山脉”、 “人物”)。内容相似的图像会彼此靠近,从而使相似性搜索和比较变得更加容易。

4. RAG – Retrieval‑Augmented Generation

典型的工作流程如下:

  1. 用户提交提示词。
  2. 检索器使用嵌入模型将查询转换为向量。
  3. 检索器在向量数据库中执行相似度搜索,返回 多个 相关的信息片段。
  4. 这些片段(此时为普通文本,而非向量)被注入到发送给 LLM 的提示词中。

这样,模型能够在生成回答时依据特定的、最新的或私有的上下文进行推理,而无需事先在这些信息上进行训练。

5. MCP – Model Context Protocol

要让大型语言模型真正有用,它必须能够与外部资源交互。仅仅在孤立的情况下生成文本是不够的;模型必须能够连接到数据库、服务以及其他工具。

MCP 是一种模式,定义了如何管理并将这些来源的信息通道化到 LLM。MCP 服务器 充当模型与外部服务(例如数据库、电子邮件系统)之间的中介,这样开发者在希望 LLM 访问新资源时就不必每次都重新实现连接。

6. MOE – Mixture of Experts

MOE 将一个大型语言模型拆分为多个专门的子网络,称为 专家。路由机制决定在给定输入时激活哪些专家,从而使整体模型能够:

  • 更高效地扩展
  • 在不同领域或任务上实现专门化
  • 通过仅使用部分参数来降低推理成本

Bottom line

AI 正以“狗年”速度前进。关注新兴概念——代理、以推理为中心的模型、基于向量的检索以及像 MOE 这样的架构技巧——将帮助你在比硬件更新更快的环境中保持竞争力。

7. Agentic RAG

如果说 RAG 的概念已经相当抽象,Agentic RAG 则更进一步。传统 RAG 只具备简单的检索、适应性有限,并且依赖静态知识;而 Agentic RAG 引入了能够决定使用何种工具、制定检索策略以及细化查询的 AI 代理,从而实现更准确、更灵活的响应。

高层工作流

  1. 激活 针对给定任务的适当专家,只使用必要的专家。
  2. 每个专家产生输出,然后通过路由机制决定的加权求和将这些输出合并。
  3. 将合并后的结果返回给用户。

这种架构能够在不在每一步都消耗模型全部资源的情况下,扩展到拥有数十亿参数的模型,从而显著优化效率和性能。

8. ASI (Artificial Super Intelligence)

而这正是人们可能冲动地想把电脑扔出窗外、转行去当农夫的时刻。就我所知,ASI 的概念更多是理论而非实践,但它确实存在,并且在技术飞速发展的背景下值得我们记在心上。

迄今为止描述的所有工具和概念——自主代理、能够“理解”你照片的数据库、决定激活哪位专家的架构——正逐步逼近 AGI(Artificial General Intelligence) 的范式。简而言之,AGI 指的是能够以人类专家水平完成任何任务的系统。

ASI 更进一步,暗示一种范围更广的系统,具备以下能力:

  • 自我改进
  • 以“优于”人类专家的方式解决问题
  • 提出我们尚未想象的难题

因此,在自主代理、能够“理解”你照片的数据库、决定激活哪位专家的架构以及始终难以捉摸的 ASI 前景之间,我们很容易感到既有点不知所措,又极度着迷。

好消息是,你不必成为大师才能搭上这趟列车:只需要好奇心、耐心和一杯浓咖啡。谁知道,也许几年后,我的烤面包机就会拥有自己的 RAG 代理,在我仍在摸索我的 LLM 在干什么时,推荐完美的早餐食谱。

Back to Blog

相关文章

阅读更多 »