第1天:回归——预测的艺术
Source: Dev.to
什么是回归?
回归的含义:
使用过去的信息来预测未来的数值。
示例
| 问题 | 类型 |
|---|---|
| 预测房价 | 回归 |
| 预测工资 | 回归 |
| 预测温度 | 回归 |
| 预测及格/不及格 | ❌ 非回归 |
👉 如果输出是一个数字 → 就是回归
为什么需要回归?
人类:
- 大致猜测
- 忘记模式
- 带有偏见
机器:
- 记住所有数据
- 清晰地看到模式
- 给出一致的预测
所以我们让 机器从过去的数据中学习 并为我们进行预测。
输入与输出
把回归想象成一台 榨汁机。
| 部分 | 机器学习术语 |
|---|---|
| 你放进去的水果 | 输入 / 特征 |
| 你得到的果汁 | 输出 / 目标 |
示例
- 输入: 房屋面积、房间数量、位置
- 输出: 房价
回归学习:“如果输入是这样 → 输出通常是那样”。
回归 vs 分类
| 回归 | 分类 |
|---|---|
| 预测数值 | 预测标签 |
| 工资 = ₹50,000 | 垃圾邮件 / 非垃圾邮件 |
| 房价 | 是 / 否 |
| 温度 | 及格 / 不及格 |
📌 面试规则: 如果输出是连续的 → 回归
实际应用案例
| 领域 | 回归的使用 |
|---|---|
| 金融 | 贷款金额预测 |
| 医疗保健 | 恢复时间 |
| 房地产 | 房价 |
| 电子商务 | 需求预测 |
| 天气 | 降雨量 |
回归 无处不在,默默工作。
监督学习
想象一个孩子在学数学。老师:
- 出一道题目
- 给出 正确答案
- 纠正错误
孩子学到:“当我看到这种题目时,答案通常是这个。”
这就是 监督学习。
将其应用到回归
在回归中,机器就是那个孩子。
- 输入: 房屋面积、房间数、位置
- 正确输出: 实际房价
模型学习:“当这些输入一起出现时,这就是价格。”
之所以称为 监督学习,是因为模型 不是盲目猜测;我们已经 知道正确答案,并通过纠正来 监督 学习过程。
记忆小技巧: 如果数据已经有正确答案 → 就是监督学习。
小的现实类比
| 情境 | 学习类型 |
|---|---|
| 老师检查作业 | 监督学习 |
| 孩子自行尝试学习 | 无监督学习 |
回归 = 老师检查作业。
回归是一种监督学习算法,因为模型从已标记、已知正确输出的数据中学习。
小练习直觉
想想你的手机价格。
- 输入: RAM、存储、品牌
- 输出: 价格
你的大脑已经在做回归。机器学习只是 更快、更好 地完成这件事。
三行要点(记住它)
- 回归预测 数值,而不是标签。
- 它从 过去的数据 中学习模式。
- 你已经在日常生活中使用回归。
接下来会讲什么
现在我们已经了解了 回归是什么,下一个问题是:
“机器是如何实际学习到最佳预测的?”
这就涉及 线性回归。
👉 第 2 天:直线如何从数据中学习