1、卷积核
进行互相关运算。
卷积核的大小一般是奇数。
卷积核的本质类似于提取局部特征(过滤器),当层层卷积核叠加后,卷积核的感受野变大,卷积核的作用逐渐向提取全局抽象特征靠近。最后一层的神经元应该对整个输入的全局敏感。通过逐渐聚合信息,生成越来越粗糙的映射,最终实现学习全局表示的目标,同时将卷积图层的所有优势保留在中间层
2、填充与步幅
都为超参数,调整数据的维度的手段。
填充可以增加输出的高度和宽度,当图片形状太小,可用填充扩大输出。
步幅可以减小输出的高和宽,当图片形状太大,可用步幅成倍减小输出形状,减少运算量。
3、多输入多输出通道
多输入通道
多输出通道
多输出通道可以看作是对不同特征的响应,不同卷积核可以提取出不同的特征。
4、1×1卷积层
1×1卷积失去了卷积层的特有能力——在高度和宽度维度上,识别相邻元素间相互作用的能力,但其可以调整网络层的通道数量和控制模型复杂性。
5、池化层(汇聚层)
解决卷积核对图像位置过于敏感的问题(如整个图像向右移动一个像素,图像拍摄角度不同,导致输出也不相同),降低卷积层对位置的敏感性,同时降低对空间降采样表示的敏感性。
最大池化层会输出该窗口内的最大值,平均池化层会输出该窗口内的平均值。
与卷积层一样,池化层也可以通过步幅和填充改变输出形状。
在处理多通道输入数据时,池化层在每个输入通道上单独运算,而不是像卷积层一样在通道上对输入进行汇总。 这意味着池化层的输出通道数与输入通道数相同。