D2L: Convolution and Pooling
Convolution and Pooling
Concept and Principle
卷积
- 平移不变性和局部性是在图片中寻找某种模式的原则。
- 因为模式不会随着其在图片中位置改变而改变,所以一个识别器(卷积核)被设计为具有平移不变性(即参数只与输入的像素值有关,而与像素在图片的位置无关),去学习图片中的一种模式
- 模式与其相邻的局部相关,识别器每次仅去看图片的一部分
- 对全连接层使用平移不变性和局部性得到卷积层
- 平移不变性和局部性是在图片中寻找某种模式的原则。
卷积层
- 不同卷积核(值)会对图片带来不同的效果,当某种效果对任务有帮助时,网络很有可能就会学习出这种卷积核
- 不同卷积核(值)会对图片带来不同的效果,当某种效果对任务有帮助时,网络很有可能就会学习出这种卷积核
填充与步幅
- 在输入的四周加入额外的行和列以控制卷积后的输出图像大小,卷积核大小一般选奇数,能上下对称地填充图片来保证输入输出图片大小不变
- 增大卷积步幅,快速缩小图片
- 总结
- 在输入的四周加入额外的行和列以控制卷积后的输出图像大小,卷积核大小一般选奇数,能上下对称地填充图片来保证输入输出图片大小不变
通道
- 每个通道有自己的卷积核,输入通道不同通道的对应卷积后直接相加后再加偏置项,最后输出一个单通道
- 多输出通道就是多个上述操作输出的多个单通道
- 每个输出通道可以识别特定的模式,输入通道识别并组合(加权相加)输入中的模式
池化
- 池化层缓解卷积对位置的敏感性
- 池化层不学习任何参数,有最大池化、平均池化等
- 池化层也可以调整填充与步幅
- 经过池化层不会改变通道数
tricks
- 填充:一般填充就是为了使图小大小不变
- 步幅:一般设置为1,计算量太大时增大步幅
- 最终图像大小:一般为3x3、5x5、7x7
- 1x1卷积层:不识别空间模式,而是用来改变通道数
Comment