池化是缩小高、长方向上的空间的运算。比如,如图7-14 所示,进行将 2 × 2 的区域集约成 1 个元素的处理,缩小空间大小。
图7-14 的例子是按步幅 2 进行 2 × 2 的
Max池化
时的处理顺序。
Max池化
是获取最大值的运算,“2 × 2”表示目标区域的大小。如图所示,从 2 × 2 的区域中取出最大的元素。此外,这个例子中将步幅设为了 2,所以 2 × 2 的窗口的移动间隔为 2 个元素。
另外,
一般来说,池化的窗口大小会和步幅设定成相同的值
。比如,3 × 3 的窗口的步幅会设为 3,4 × 4 的窗口的步幅会设为 4 等。
除了
Max
池化之外,还有
Average
池化等。相对于
Max
池化是从目标区域中取出最大值,
Average
池化则是计算目标区域的平均值。在图像识别领域,主要使用
Max
池化。
通过池化层的计算,我们也能总结出一个通用公式,用于计算输入的特征图经过一轮池化操作后输出的特征图的宽度和高度:
-
W
和
H
分别表示特征图的宽度和高度值;
-
下标
input
表示输入的特征图的相关参数;
-
下标
output
表示输出的特征图的相关参数;
-
下标
filter
表示滑动窗口的相关参数;
-
S
表示滑动窗口的步长,并且输入的特征图的深度和滑动窗口的深度保持一致。