图像分类与CNNs – 第3部分：理解最大池化和结果

发布: 3天前 (2026年2月13日 GMT+8 04:30)

3 分钟阅读

原文: Dev.to

Source: Dev.to

最大池化

在上一篇文章中我们创建了特征图。
现在我们对该特征图再应用一个滤波器。
该滤波器不再计算点积，而是在每个区域中选取最大值，并且移动时不与自身重叠。

Max pooling illustration

当我们从每个区域取最大值时，就在执行最大池化。
最大池化保留了滤波器与输入图像最匹配的区域。

Max pooling result

另一种做法是计算每个区域的平均（均值），这种操作称为平均池化（或均值池化）。

池化之后，得到的特征图会被重新形成为输入节点的列向量（展平向量），以便送入全连接网络。

Flattened layer

展平后的向量会连接到全连接神经网络：

Fully connected network diagram

本例使用的网络结构：

隐藏节点的加权和

[ (1 \times -0.8) + (0 \times -0.07) + (0 \times 0.2) + (1 \times 0.17) = -0.63 ]
加上偏置

[ -0.63 + 0.97 = 0.34 ]

送入 ReLU 激活函数的输入为 0.34。
应用 ReLU

[ \text{ReLU}(0.34) = \max(0, 0.34) = 0.34 ]
输出层
- 对于字母 O，在乘以输出权重并加上偏置后，结果为 1。
- 对于字母 X，结果为 0。

因此，当输入图像为字母 O 时，网络能够正确地将其分类为 O。
相同的过程可以对字母 X 进行，下一篇文章将会介绍。