VGGNet
结构
- 输入尺寸:224x224RGB图像
- 预处理:图像每个像素减去RGB平均值
- 卷积步幅为1,保持卷积后分辨率
- 使用最大池化,大小2x2,步幅为2
- 最后是3个全链接层,第一二有4096个神经元,第三个是1000个神经元,对应1000分类,也是soft-max层
- 所有隐藏层使用Relu作为激活函数
- 没有使用数据规范化:认为对于ILSVRC数据集无效,且浪费计算资源
配置
VGGNET:共有A-E,五个模型
8conv+3fc--------》16conv+3fc, 添加了conv3,或conv1
- 1x1 卷积是在不影响感受域的前提下,增加非线性函数的一种方式
- 滤波器数量64开始,每池化一次,翻倍,直到512
- 使用3x3代替7x7,5x5,减少参数量,增加了激活次数
评论已关闭