结构

  • 输入尺寸:224x224RGB图像
  • 预处理:图像每个像素减去RGB平均值
  • 卷积步幅为1,保持卷积后分辨率
  • 使用最大池化,大小2x2,步幅为2
  • 最后是3个全链接层,第一二有4096个神经元,第三个是1000个神经元,对应1000分类,也是soft-max层
  • 所有隐藏层使用Relu作为激活函数
  • 没有使用数据规范化:认为对于ILSVRC数据集无效,且浪费计算资源

配置

VGGNET:共有A-E,五个模型

  • 8conv+3fc--------》16conv+3fc, 添加了conv3,或conv1

    • 1x1 卷积是在不影响感受域的前提下,增加非线性函数的一种方式
  • 滤波器数量64开始,每池化一次,翻倍,直到512
  • 使用3x3代替7x7,5x5,减少参数量,增加了激活次数

vggnet

原文

标签: none

评论已关闭