图像分类与CNNs – 第3部分:理解最大池化和结果

发布: (2026年2月13日 GMT+8 04:30)
3 分钟阅读
原文: Dev.to

Source: Dev.to

最大池化

上一篇文章中我们创建了特征图。
现在我们对该特征图再应用一个滤波器。
该滤波器不再计算点积,而是在每个区域中选取最大值,并且移动时不与自身重叠

Max pooling illustration

当我们从每个区域取最大值时,就在执行最大池化
最大池化保留了滤波器与输入图像最匹配的区域。

Max pooling result


平均池化

另一种做法是计算每个区域的平均(均值),这种操作称为平均池化(或均值池化)。


对池化层进行展平

池化之后,得到的特征图会被重新形成为输入节点的列向量(展平向量),以便送入全连接网络。

Flattened layer


全连接神经网络

展平后的向量会连接到全连接神经网络

Fully connected network diagram

本例使用的网络结构:

  • 4 个输入节点(对应展平向量的每个元素)
  • 一个隐藏层,使用 ReLU 激活函数
  • 2 个输出节点,分别代表字母 OX

示例计算

  1. 隐藏节点的加权和

    [ (1 \times -0.8) + (0 \times -0.07) + (0 \times 0.2) + (1 \times 0.17) = -0.63 ]

  2. 加上偏置

    [ -0.63 + 0.97 = 0.34 ]

    送入 ReLU 激活函数的输入为 0.34

  3. 应用 ReLU

    [ \text{ReLU}(0.34) = \max(0, 0.34) = 0.34 ]

  4. 输出层

    • 对于字母 O,在乘以输出权重并加上偏置后,结果为 1
    • 对于字母 X,结果为 0

因此,当输入图像为字母 O 时,网络能够正确地将其分类为 O
相同的过程可以对字母 X 进行,下一篇文章将会介绍。

0 浏览
Back to Blog

相关文章

阅读更多 »