图像分类与CNNs – 第3部分:理解最大池化和结果
发布: (2026年2月13日 GMT+8 04:30)
3 分钟阅读
原文: Dev.to
Source: Dev.to
最大池化
在上一篇文章中我们创建了特征图。
现在我们对该特征图再应用一个滤波器。
该滤波器不再计算点积,而是在每个区域中选取最大值,并且移动时不与自身重叠。

当我们从每个区域取最大值时,就在执行最大池化。
最大池化保留了滤波器与输入图像最匹配的区域。

平均池化
另一种做法是计算每个区域的平均(均值),这种操作称为平均池化(或均值池化)。
对池化层进行展平
池化之后,得到的特征图会被重新形成为输入节点的列向量(展平向量),以便送入全连接网络。

全连接神经网络
展平后的向量会连接到全连接神经网络:

本例使用的网络结构:
- 4 个输入节点(对应展平向量的每个元素)
- 一个隐藏层,使用 ReLU 激活函数
- 2 个输出节点,分别代表字母 O 和 X
示例计算
-
隐藏节点的加权和
[ (1 \times -0.8) + (0 \times -0.07) + (0 \times 0.2) + (1 \times 0.17) = -0.63 ]
-
加上偏置
[ -0.63 + 0.97 = 0.34 ]
送入 ReLU 激活函数的输入为 0.34。
-
应用 ReLU
[ \text{ReLU}(0.34) = \max(0, 0.34) = 0.34 ]
-
输出层
- 对于字母 O,在乘以输出权重并加上偏置后,结果为 1。
- 对于字母 X,结果为 0。
因此,当输入图像为字母 O 时,网络能够正确地将其分类为 O。
相同的过程可以对字母 X 进行,下一篇文章将会介绍。