Logistic Regression，但改成茶：ML 基础热腾腾

发布: 5天前 (2025年12月20日 GMT+8 23:45)

5 min read

原文: Dev.to

Source: Dev.to

什么是 Logistic 回归？

Logistic 回归是一种用于预测 是/否结果 的简单机器学习算法。

想象你在经营一个小茶摊，想预测路人是否会买茶。
你可能会考虑的特征有：

时间
天气
这个人是否看起来很疲惫
他是否在赶时间

Logistic 回归会把这些特征转换成 0 到 1 之间的概率，例如 “有 70 % 的概率他们会买茶”。

1. 成本函数 — 衡量错误程度

成本函数 用来量化模型预测与真实情况之间的差异。

成本越低 → 模型越好。

茶摊类比

如果你要猜 100 个人是否会买茶：

猜得准 → 成本低
经常猜错 → 成本高

模型通过 最小化这个成本 来学习。

2. Logistic 损失（Log‑Loss / 二元交叉熵）

因为 Logistic 回归预测的是概率，我们使用 Logistic 损失 而不是简单的错误计数。它对“自信但错误”的预测惩罚更重，而对不确定的预测惩罚较轻。

茶摊类比

预测 90 % 的购买概率，但对方没有买 → 惩罚很大
预测 55 % 的购买概率，且对方没有买 → 惩罚较小

Logistic 损失鼓励模型给出更真实的概率估计。

3. 梯度下降 — 模型的学习方式

梯度下降是一种优化方法，迭代地调整模型参数以最小化成本函数。

类比

想象站在雾蒙蒙的山坡上，通过感受坡度一步步向下走。每一步都降低海拔（成本），直到到达最低点。

茶摊示例

寻找最佳茶价：

₹20 → 买家少
₹10 → 买家多
₹8 → 更多买家
₹6 → 价格太低，利润下降

通过微小的调整，你会找到最佳价位。梯度下降对模型权重进行同样的增量更新。

4. 过拟合问题 — 当模型变得“太聪明”

过拟合指模型记住了训练数据而不是学习到一般模式。

茶摊类比

在 100 位顾客中，只有一个穿 红色衬衫 的人买了茶。
一个过拟合的模型会学到 “红衬衫 = 必买茶”，这显然不对——它学到了噪声。

症状

在训练数据上表现极佳
在新、未见过的数据上表现糟糕

5. 如何防止过拟合

常用策略：

使用更多数据
简化模型
使用 正则化（对 Logistic 回归尤为重要）

6. 正则化 — 让模型保持脚踏实地

正则化在成本函数中加入惩罚项，阻止模型对无关特征赋予过大权重。

茶摊类比

如果你开始记录琐碎细节（鞋子品牌、手机颜色、包的重量、发长），模型可能会过拟合。正则化告诉它忽略这些噪声特征，专注于天气、时间、疲惫程度等有意义的特征。

7. 正则化 Logistic 回归 — 更聪明的成本函数

正则化后的成本函数为：

Total Cost = Logistic Loss + Regularization Penalty

正则化类型

L1（Lasso）： 可以将无用特征的权重置为零。
L2（Ridge）： 平滑地收缩特征权重。

茶摊示例

正则化会惩罚模型如果它试图学习诸如：

“红衬衫的人总是买茶”
“黑鞋的人很少买茶”

这样可以保持模型的可推广性和稳定性。

结论

通过熟悉的茶摊情境，我们已经介绍了 Logistic 回归的核心概念：成本函数、Logistic 损失、梯度下降、过拟合以及正则化。这些概念构成了大多数机器学习算法的基础。

Logistic Regression，但改成茶：ML 基础热腾腾

什么是 Logistic 回归？

1. 成本函数 — 衡量错误程度

茶摊类比

2. Logistic 损失（Log‑Loss / 二元交叉熵）

茶摊类比

3. 梯度下降 — 模型的学习方式

类比

茶摊示例

4. 过拟合问题 — 当模型变得“太聪明”

茶摊类比

5. 如何防止过拟合

6. 正则化 — 让模型保持脚踏实地

茶摊类比

7. 正则化 Logistic 回归 — 更聪明的成本函数

正则化类型

茶摊示例

结论

相关文章

🍵 Linear Regression 零基础入门——茶的零知识类比

使用机器学习预测茶叶销售：线性回归、梯度下降与正则化（适合初学者 + 代码）

机器学习“降临节日历”第14天：Excel中的Softmax回归

机器学习“Advent Calendar”第11天：Excel中的线性回归