🌟 终极记忆技巧:AWS 认证 AI Practitioner(AIF-C01)
发布: (2025年12月8日 GMT+8 00:47)
4 min read
原文: Dev.to
Source: Dev.to
机器学习基础
监督学习 vs 无监督学习
- 有标签 → 监督学习
- 无标签 → 无监督学习
✔ 监督学习 = 教师 + 正确答案
✔ 无监督学习 = 找模式(聚类、分段)
分类 vs 回归
- 离散类别 → 分类
- 连续数值 → 回归
过拟合 vs 欠拟合
- 过拟合 = 模型过于复杂 → 增加正则化
- 欠拟合 = 模型过于简单 → 减少正则化
关键算法
- 聚类 – 对客户进行分组?没有标签?→ K‑Means
- 图像分类 – 花卉分类 → k‑NN 或 Decision Tree
- 异常检测 – 无标签 + 异常检测 → Autoencoders
生成式 AI Prompt 工程
- Few‑shot 提示 – 展示格式 → Few‑shot 提示。
- Prompt 链接 – 多步骤工作流 → Prompt 链接。
- ReAct 提示 – 推理 + 行动 + 工具使用 → ReAct。
温度 (Temperature)
- 创造力 ↑ → 温度 ↑
- 一致性 ↑ → 温度 ↓
大语言模型推理参数
- Temperature – 创造力
- Top‑K – 候选 token 数量
- Top‑P – 概率阈值
- Max Tokens – 输出长度
- Frequency Penalty – 降低重复词
- Presence Penalty – 抑制重复主题
映射关系
- 创造力 → Temperature / Top‑K / Top‑P
- 长度 → Max Tokens
- 重复 → Frequency & Presence
检索增强生成 (RAG)
切块的目的
切块 = 更好检索 → 更好上下文
RAG 中的批处理步骤
- ✔ 内容嵌入
- ✔ 构建搜索索引
不要在此批处理中包含查询嵌入或响应生成。
多模态搜索的 LLM 类型
文本 + 图像查询 → 多模态模型
评估机器学习模型
摘要指标
- ROUGE(默认)
- 若缺少 ROUGE → 选择 BLEU
翻译指标
- BLEU / METEOR
分类指标
- 数据不平衡 → F1 Score
- 数据平衡 → Accuracy
回归指标
- 数值预测 → MSE / RMSE
大语言模型质量
- Perplexity – 模型的惊讶程度?
AWS 服务 – 快速记忆点
- Model Cards – 治理 + 文档
- Model Monitor – 检测生产中的漂移
- Ground Truth – 人工标注
- JumpStart – 预构建模型 + 快速部署
- SageMaker Canvas – 无代码数据准备
- HealthScribe – 医学语音转文字
- Guardrails for Bedrock – 负责任的 AI(安全过滤器)
- PartyRock – 实验 + 学习 + 免费 (不适用于 VPC,也不用于部署)
生成式 AI 生命周期
设计 → 数据 → 训练 → 评估 → 部署 → 监控
评估阶段
- 准确率测试
- 安全性 + 毒性测试
- 幻觉(Hallucination)测量
推理
- Train = 学习
- Infer = 预测
- Deploy = 服务
嵌入 (Embeddings)
- Embeddings = 含义 → 向量
- 降维 → 相同含义 → 相似度搜索
基础概念
微调 (Fine‑tuning)
让大模型在小任务上表现出色。
- 领域特定的标注数据
- 提升特定任务性能
- 不 从头重新训练
- 不 更新模型以适应最新事件
负责任的 AI
安全 + 过滤 + 检测毒性 → 使用 Guardrails
最后思考
这些记忆点旨在:
- 在考试中实现即时回忆
- 减少相似概念之间的混淆
- 通过模式而非记忆定义来建立信心
本内容基于 QA/CloudAcademy 课程 “AWS Certified AI Practitioner (AIF‑C01) Certification Preparation” 由 Danny Jessee 提供的洞见编写。