🌟 终极记忆技巧:AWS 认证 AI Practitioner(AIF-C01)

发布: (2025年12月8日 GMT+8 00:47)
4 min read
原文: Dev.to

Source: Dev.to

机器学习基础

监督学习 vs 无监督学习

  • 有标签 → 监督学习
  • 无标签 → 无监督学习

✔ 监督学习 = 教师 + 正确答案
✔ 无监督学习 = 找模式(聚类、分段)

分类 vs 回归

  • 离散类别 → 分类
  • 连续数值 → 回归

过拟合 vs 欠拟合

  • 过拟合 = 模型过于复杂 → 增加正则化
  • 欠拟合 = 模型过于简单 → 减少正则化

关键算法

  • 聚类 – 对客户进行分组?没有标签?→ K‑Means
  • 图像分类 – 花卉分类 → k‑NNDecision Tree
  • 异常检测 – 无标签 + 异常检测 → Autoencoders

生成式 AI Prompt 工程

  • Few‑shot 提示 – 展示格式 → Few‑shot 提示。
  • Prompt 链接 – 多步骤工作流 → Prompt 链接。
  • ReAct 提示 – 推理 + 行动 + 工具使用 → ReAct。

温度 (Temperature)

  • 创造力 ↑ → 温度 ↑
  • 一致性 ↑ → 温度 ↓

大语言模型推理参数

  • Temperature – 创造力
  • Top‑K – 候选 token 数量
  • Top‑P – 概率阈值
  • Max Tokens – 输出长度
  • Frequency Penalty – 降低重复词
  • Presence Penalty – 抑制重复主题

映射关系

  • 创造力 → Temperature / Top‑K / Top‑P
  • 长度 → Max Tokens
  • 重复 → Frequency & Presence

检索增强生成 (RAG)

切块的目的

切块 = 更好检索 → 更好上下文

RAG 中的批处理步骤

  • ✔ 内容嵌入
  • ✔ 构建搜索索引

不要在此批处理中包含查询嵌入或响应生成。

多模态搜索的 LLM 类型

文本 + 图像查询 → 多模态模型

评估机器学习模型

摘要指标

  • ROUGE(默认)
  • 若缺少 ROUGE → 选择 BLEU

翻译指标

  • BLEU / METEOR

分类指标

  • 数据不平衡F1 Score
  • 数据平衡Accuracy

回归指标

  • 数值预测 → MSE / RMSE

大语言模型质量

  • Perplexity – 模型的惊讶程度?

AWS 服务 – 快速记忆点

  • Model Cards – 治理 + 文档
  • Model Monitor – 检测生产中的漂移
  • Ground Truth – 人工标注
  • JumpStart – 预构建模型 + 快速部署
  • SageMaker Canvas – 无代码数据准备
  • HealthScribe – 医学语音转文字
  • Guardrails for Bedrock – 负责任的 AI(安全过滤器)
  • PartyRock – 实验 + 学习 + 免费 (不适用于 VPC,也不用于部署)

生成式 AI 生命周期

设计 → 数据 → 训练 → 评估 → 部署 → 监控

评估阶段

  • 准确率测试
  • 安全性 + 毒性测试
  • 幻觉(Hallucination)测量

推理

  • Train = 学习
  • Infer = 预测
  • Deploy = 服务

嵌入 (Embeddings)

  • Embeddings = 含义 → 向量
  • 降维 → 相同含义 → 相似度搜索

基础概念

微调 (Fine‑tuning)

让大模型在小任务上表现出色。

  • 领域特定的标注数据
  • 提升特定任务性能
  • 从头重新训练
  • 更新模型以适应最新事件

负责任的 AI

安全 + 过滤 + 检测毒性 → 使用 Guardrails

最后思考

这些记忆点旨在:

  • 在考试中实现即时回忆
  • 减少相似概念之间的混淆
  • 通过模式而非记忆定义来建立信心

本内容基于 QA/CloudAcademy 课程 “AWS Certified AI Practitioner (AIF‑C01) Certification Preparation” 由 Danny Jessee 提供的洞见编写。

Back to Blog

相关文章

阅读更多 »