致那些在 AI 竞争中被落后的人们
发布: (2026年2月1日 GMT+8 05:16)
4 min read
原文: Dev.to
Source: Dev.to
Cheat Sheet: Key AI Concepts
- NLP (Natural Language Processing) – 使计算机能够理解、解释和生成人类语言的人工智能领域。
- LLM (Large Language Model) – 在海量文本语料上进行训练,以预测下一个词,从而实现聊天、写作和摘要等功能。
- LMM (Large Multimodal Model) – 将 LLM 的能力扩展到处理图像、音频、视频等多模态数据。
- Foundational Model – 大规模、通用的模型(例如 GPT‑4),可作为众多下游任务的基础。
- Multimodal – 能够处理并关联不同类型的数据(例如用文字描述图像)。
- Prompt Engineering – 精心设计指令,以从 AI 模型中获得最佳响应。
- Finetune – 在较小、特定任务的数据集上对预训练模型进行二次训练。
- RAG (Retrieval‑Augmented Generation) – 将 AI 与外部知识库相连,使其能够实时检索事实,降低幻觉产生。
- Embedding Model – 将文本或图像转换为捕捉语义的数值向量,以实现相似度比较。
- AI Engineering – 使用现成的 AI 模型构建完整应用,侧重于集成、安全、成本和可用性。
- ML Engineering (Machine Learning Engineering) – 从零开始设计、训练和优化模型,包括数据清洗和算法改进。
- Agentic AI – 能够自主行动的 AI:将目标拆解为步骤,使用工具(如网页搜索、预订),完成任务。
- MLOps (Machine Learning Operations) – 确保 AI 模型在生产环境中保持更新、可监控和可靠的实践。
Real‑World Project Pipeline (Customer Support Agent)
| Role | Responsibilities |
|---|---|
| ML Engineer | 设计并训练“大脑”;可能为特定领域术语构建自定义嵌入模型。 |
| AI Engineer | 将大脑连接到外部世界;集成基础模型(例如 GPT‑4),搭建 RAG,并进行提示工程。 |
| MLOps Engineer | 构建“工厂”;确保可扩展性、可靠性以及持续监控,以防止漂移或崩溃。 |
AI Engineer Stack: 常用工具
- 编排(工作流粘合剂) – LangChain, LlamaIndex
- 向量数据库(RAG 存储) – Pinecone, Weaviate, Chroma
- 应用构建器与 UI – Streamlit, Gradio
- 评估与可观测性 – LangSmith, Arize Phoenix
- 本地开发 – Ollama, LM Studio
领先工具与模型概览
基础模型
- 文本与通用推理:OpenAI GPT‑4o,Anthropic Claude 3.5 Sonnet,Google Gemini 1.5 Pro,Meta Llama 3(开源领袖)。
- 图像生成:Stable Diffusion,Midjourney
- 视频生成:Synthesia(讲话头像),Google Veo(电影剪辑)
AI 应用与助理
- 编码助理 – GitHub Copilot
- 会议自动化 – Fireflies.ai(录音、转录、摘要)
- 搜索与研究 – Perplexity AI(带引用的对话式搜索)
- 工作流助理 – Lindy(多步骤业务工作流)
RAG 工具
- 框架 – LlamaIndex(索引与检索),LangChain(应用逻辑)
- 向量数据库 – Pinecone(托管),Weaviate(开源),Chroma
- 评估 – LangSmith,Arize Phoenix
代理式 AI
- 多代理团队 – CrewAI,Microsoft AutoGen(角色特定的 AI 代理)
- 复杂工作流 – LangGraph(任务控制、人类批准步骤)
- 自主编码 – Goose,Claude Code(编辑文件、运行测试)
其他重要工程工具
- 本地 AI 运行器 – Ollama(本地运行 Llama 3 等开源模型)
- 模型优化 – DSPy(自动提示优化)