1,摘要

​ 面向对象的城市建筑物信息提取方法在实际应用中存在精度不高、后处理工作量大等局限。本文分析了FCN、U-Net、SegNet的优点与不足,在U-Net网络的基础上,通过融合多个级别的特征层,构建了一种多级特征参与决策的全卷积神 经网络算法。

​ 为充分利用 GF-2 卫星影像的全色和多光谱数据,本文设计了单输入和双输入两种模型,其中双输入模型可以综合学习两个分辨率数据中的特征,能够对城市建筑物信息进行学习和融合。

技术路线图

2,卷积网络知识了解

参见其他文章

3,多级特征参与决策的全卷积神经网络构建

​ 一般的全卷积神经网络,在最后一层分类,只利用的最后一层特征。FNC,Unet,SegNet 浅层特征只在模型中进行的融合,并没有直接参与到最后的决策

​ 本文:将用于输入分类器的特征层称为决策层,具体是将网络中多个层级的特征经过处理融合到决策层中,得到了多级特征参与决策的全卷积神经网络。

3.1,全卷积神经网络

图 构建

  • FCN:基础网络(编码部分)是VGG16 ,解码部分FCN32s,FCN16s,FCN8s,对于小数据集泛化程度不好。
  • SegNet:编码部分还是Vgg16 中的13层卷积,解码部分使用几乎和下采样对应的结构还原尺寸。

    • 所有对应层都做融合,充分应用边缘信息。
    • 上采样结构中对池化运算逆操作的改进,具体做法是在下采样池化运算时增加一类编码器,专门用来存储池化窗口中最大值神经元所对应的 位置索引,在上采样的反池化运算中根据该编码器将最大值赋予对应索引位置的神经元, 而其他位置神经元赋值为 0,这种反池化操作更加高效地还原了图像的位置信息。
  • U-net:

    • 在上采样时,经对应层的数据特征在通道上链接
    • 没有补零操作,融合时需要剪切,最后目标图片变小,

    • 一般使用时斗需要改进

3.2,U-net改进

  • 补零策略
  • 调整适应不同大小图片
  • 卷积核数量固定64,(通常是每次池化时,卷积核数量翻倍)
  • 多极特征融合

    • 上采样中所有的特征层都参到最后的决策
    • unet 在上采样回复尺寸时,使用 strdie为2的反卷积,然后再接卷积。本文使用upsampling代替unet反卷积,使用反卷积代替unet中的卷积。

      • uet解码部分 :Conv2dTranspose--->Conv--->Conv
      • 本文解码部分:Upsampling----->Conv2dTranspose-->Conv2dTranspose

4,双输入模型

​ 双输入模型在结构上是先为 3.2 米分辨率数据重新设计了一个用于特征提取的卷积 神经网络,然后将其附着在 0.8 米分辨率分支网络上,使每一层特征层与网络的 0.8 米分辨率分支上采样过程对应尺寸的特征层进行连接融合。

标签: none

评论已关闭