【论文阅读】FlipCAM:高分辨率遥感影像弱监督建筑物提取的特征级翻转增强方法

news/2024/4/28 14:39:10/文章来源:https://blog.csdn.net/W_zyth/article/details/137118876

【论文阅读】FlipCAM:高分辨率遥感影像弱监督建筑物提取的特征级翻转增强方法

文章目录

  • 【论文阅读】FlipCAM:高分辨率遥感影像弱监督建筑物提取的特征级翻转增强方法
    • 一、介绍
    • 二、方法
      • 2.1 准备
      • 2.2 一致性的架构
      • 2.3 SAM模块
      • 2.4 建筑提取模式
    • 三、实验结果

FlipCAM: A Feature-Level Flipping Augmentation Method for Weakly Supervised Building Extraction From High-Resolution Remote Sensing Imagery

为准确提取建筑物,深度神经网络需要收集大量的像素级标注,耗费大量时间

带有图像级注释的弱监督语义分割(WSSS)方法是一种有效的建筑物提取方法

  

问题:

  • 图像级标签缺乏空间信息,导致建筑物提取存在部分完整性和空洞现象
  • 遥感图像中复杂的背景会导致建筑物边界的提取不准确

  

提出了一种新的弱监督建筑提取方法FlipCAM来应对这些挑战。

基于特征级翻转增强的翻转模块通过融合原始和翻转特征图来提高CAM热图的完整性

通过将Flip模块与基于一致性架构的slice and merge (SAM)模块相结合

  

解决:

  • FlipCAM能够端到端生成高质量的CAM热图,既具有边界精细度,又具有内部完整性
  • 这也缓解了建筑物提取的特殊困难,包括密集建筑物中的粘连以及与背景和阴影的混淆,

  
  

一、介绍

从遥感影像中提取建筑物对于城市规划[1]、[2]、人口估算[3]、土地覆盖制图[4]等地理应用具有重要意义

论文是二值分割任务

我们在实际工作中依然是多类的语义分割

  

建筑物提取的主要目的是将遥感图像中的每个像元分配为建筑物或非建筑物标签

深度卷积神经网络(deep convolutional neural network, DCNNs)因其处理丰富数据的强大能力而被广泛应用于建筑物提取中

全卷积网络(FCN)可以充分利用像素间的空间上下文信息,通过CNN的接受场提取多层次特征

  

人们提出了许多不完全标注方法来提取遥感图像中的建筑物

图像级弱监督方法更具实用性和挑战性,因为其中图像级标注的成本最优

使得弱监督方法难以达到与完全监督语义分割(FSSS)方法相同的性能

  

图像级弱监督语义分割(WSSS)方法主要步骤:

  • 训练具有图像级标签的分类网络,获得具有目标定位能力的类激活图
  • 伪掩码由CAM热图生成,作为一系列后处理的粗建筑提取结果
  • 利用伪掩码训练常规语义分割网络,提取细粒度建筑区域

  

于图像级标签严重缺乏边界信息和空间位置信息,与完全监督的像素级标签相比,伪掩码通常存在边界精细度不足和内部完整性不足两大不足

解决的方式:

  • 条件随机场(CRF)和 CRF loss
  • AffinityNet 和 IRN 提高伪掩模的边界精细度
  • 受CRF损耗的启发,提出了边界损耗 和 边界模块,以端到端方式解决边界问题。
  • 自监督原理的一致性正则化方法[38]、[39]、[40]、[41]因其在挖掘边界和多尺度信息方面的性能较好而受到欢迎
  • 一致性架构中创建适当的增强图像是至关重要的,因为这些图像可以提供图像级标签之外的监督
  • 有几种方法尝试通过多种子[46]、[47]、[48]、[49]、[50]、聚类[51]、改进损失函数[52]
  • 结合深度学习的新思想,提出了不确定性估计[58]、对比学习[59]、原型探索[41]、[60]
  • 注意力模块[61]-[68]的弱监督方法
      

这些计算机视觉中的弱监督方法不能直接应用于遥感图像

设计适合高分辨率遥感图像的WSSS方法至关重要

  

基于低成本高效提取地理目标的迫切需求,

已有研究对高分辨率遥感图像的图像级弱监督提取任务进行了针对性改进

提出了一种从粗到细的弱监督方法来解决标签噪声、边界模糊、类别不平衡等特殊提取问题

  
与上述地理对象相比,更多的研究集中在弱监督建筑提取上

这些研究倾向于将边界细化和完整性增强的步骤分开,而不是端到端的方式

  

由于弱监督方法中已经存在许多子步骤,继续分离步骤将大大降低提取效率

我认为的端到端的方法不可缺少的就是分割seg的引入

  

方法将一致性架构与两个主要的新颖模块(即SAM模块和Flip模块)集成到一个通用分类网络中

以生成高质量的CAM热图,从而获得高置信度的伪掩码

  

在弱监督任务中,监督信息的稀缺性导致问题:

  • 导致了边界精细度不足
  • 内部完整性不足
      

FlipCAM方法:

  • 一致性架构
  • SAM模块
  • Flip模块

  

以一致性和特征增强的方式在分类网络中引入多个分支,从而增加像素相关性

采用一致性正则化方法,在分支中加入适当的模块,如SAM模块和Flip模块

  

  • SAM模块通过SAM操作和多尺度图像输入增强边界能力和多尺度特征提取能力
  • Flip模块在深度神经网络中实现了原始和翻转特征映射之间的交互

  

FlipCAM中的两个模块在迭代网络训练过程中同时提高了建筑物提取性能,因此在CAM热图生成过程中是一种端到端训练策略

  
主要贡献:

  • 设计了一个名为Flip模块的原创模块,提高建筑物提取的内部完整性
  • 设计了一个名为SAM模块的原始模块,丰富多尺度信息用于提取建筑物
  • 一致性架构将Flip模块和SAM模块相结合,提高了端到端CAM热图生成的边界精细度和内部完整性

  
  

二、方法

FlipCAM是一种图像级弱监督建筑物提取方法,分为两个步骤:

  • 训练分类网络并生成伪掩码
  • 训练分割网络并输出结果

  

提出的FlipCAM方法流程图

在这里插入图片描述
  

2.1 准备

CAM方法的核心是将图像级标签转换为粗像素级标签。首先,在生成CAM之前,需要对分类网络进行训练。为了提高分类网络的特征提取能力,我们使用了二元交叉熵损失函数LBCE

在这里插入图片描述
但考虑到CAM的生成需要使用global average pooling (GAP)层,本研究选择自带GAP层的ResNet-50作为骨干网

GAP层压缩这些特征映射,以便于连接到参数w∈R2C的全连接层
  

在这里插入图片描述
二元分类,因此sb需要通过softmax激活函数进行归一化处理,得到分类概率

Sc表示各类别经过全连通层后的得分。那么,如图3所示,提取建筑物的原始CAM Mb

在这里插入图片描述

  
CAM的生成原理是建筑物的预测值与最后一层卷积生成的特征图的线性组合

  

CAM方法利用图像级标签来实现粗略的建筑物提取。

然而,仍然存在两个挑战:

  • 在使用分类网络提取建筑特征时,由于受粗粒度标注、单一损失函数设置、卷积过程和池化过程的影响,建筑边界信息损失严重;
  • 分类网络往往只关注类别中最具判别性的特征区域来实现准确的分类,导致CAM结果只关注建筑物的局部区域

  

2.2 一致性的架构

在弱监督建筑物提取任务中很好地拟合目标边界

该体系结构的核心思想是通过一致性正则化加入额外的监督来提高模型性能
  

模型通过引入额外的输入分支来实现一致性正则化

如SAM、翻转、旋转、重新缩放等

  

吸收额外的监督信息,特别是更细粒度的对象边界信息,最终提高模型的性能。

CAM方法的本质是利用分类网络进行粗语义分割任务。然而,分类网络和分割网络的参数优化方式存在巨大差异

理想情况下,分割网络趋于等值,可以达到以下效果:

在这里插入图片描述

Ib为建筑物图像样本

T和T−1分别表示变换和倒变换
  

一致性架构由两个分支组成,它们具有共享的网络权重,但输出不同的特征映射

基于原始图像的特征映射和倒转特征映射,我们可以建立如下的一致性正则化损失函
  

保证两个分支输出的激活图不断正则化,从而增强模型提取建筑边界的能力。
  

2.3 SAM模块

为了提高分类网络提取多尺度建筑物的性能,设计了SAM模块

SAM模块[见图4(b)]将不同尺度的遥感图像放入网络中,更适合多尺度遥感场景

  

每个用于训练的图像沿着两个中心轴被切成四个部分,每个部分利用分类网络生成切片的特征图

将它们上采样到原始图像的大小是不必要的。虽然图像大小的变化

  

SAM模块通过在特征映射进入全连接层之前对切片特征映射执行合并操作来解决这个问题

合并后的特征图通过l一致性与另一个分支的特征图相连,不断向网络贡献多尺度建筑信息

在这里插入图片描述

一致性架构实现了对建筑物提取结果边界的优化,但提取结果的完整性仍然得不到保证,容易出现空洞现象

Flip模块通过在特征级融合特征映射来集成高维特征信息。这可以让网络对建筑的整体表象有更深入的了解,从而增强建筑的整体性

  

为了提高CAM的完整性,我们选择了翻转变换,而不是使用其他常用的增强方法来增强特征图,
  

原因如下:首先,一些图像增强方法,如图像旋转、图像缩放、图像平移等,由于数据增强前后变化不大,无法提供足够的监督

图像裁剪并不适用于地理目标可能出现在任何位置的遥感图像

原始图像相比,翻转变换既不会提供有限的监督,也不会丢失空间和位置信息。翻转变换作为一种镜像变换

  

2.4 建筑提取模式

FlipCAM的两个分支共享CNN主干的权值,训练出的网络参数在两个分支之间是唯一且一致的

生成FlipCAM热图,并通过Otsu算法生成阈值热图,将建筑物与背景区分开来

  
伪掩模通过考虑像素之间的空间关系和像素值的相似性来整合上下文信息,提高建筑边界的精细度
  

DeepLabv3+的主要创新是集成了空间金字塔池(ASPP)和编码器-解码器架构

通过LBCE对分割网络DeepLabv3+进行训练后,将未经任何筛选处理的测试图像放入训练好的分割网络中

  

三、实验结果

多种类型建筑物的ISPRS二维语义分割基准数据集((Potsdam数据集和Vaihingen数据集),AIRS

在这里插入图片描述
  
CAM的热力图效果示意

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_1027400.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络工程师实验命令(华为数通HCIA)

VRP系统的基本操作 dis version #查看设备版本信息 sys #进入系统视图 system-name R1 #改设备名字为R1进入接口配置IP地址 int g0/0/0 ip address 192.168.1.1 255.255.255.0 #配置接口地址为192.168.1.1/255.255.255.0 ip address 192.168.1.2 24 sub #此…

【C语言】预处理常见知识详解(宏详解)

文章目录 1、预定义符号2、define2.1 define 定义常量2.2 define 定义宏 3、#和##3.1 **#**3.2 **##** 4、条件编译(开关) 1、预定义符号 在C语言中内置了一些预定义符号,可以直接使用,这些符号实在预处理期间处理的,…

云蜜罐技术(德迅猎鹰)诞生

数字化程度高且高价值信息密集的行业,如金融、能源、互联网、政府、教育、医疗、军工等行业,面对日益规模化、专业化的网络攻击,渐渐不再满足于一味的防守加固。除了巩固防线之外,他们愈发看重主动出击、感知更大范围内的攻击&…

uniapp调用腾讯图形验证码,兼容h5、APP(安卓)

因项目要兼容安卓APP&#xff0c;所以使用webview做成了一个组件 新建hybrid文件夹&#xff0c;创建要在webview引入的html文件 <!DOCTYPE html> <html><head><meta charset"utf-8" /><meta name"viewport"content"widt…

Jenkins拉取github项目相关问题

1.私有仓库问题 1.1如果你的仓库是私有的&#xff0c;21年起github就不支持账号密码的方式拉取代码了 那么就需要在github上面创建一个token (classic) 然后在Jenkins代码设置那里 然后应该就可以顺利打包了。 2.找不到pom&#xff08;多了一层文件夹&#xff09;问题 解…

Svg Flow Editor 原生svg流程图编辑器(四)

系列文章 Svg Flow Editor 原生svg流程图编辑器&#xff08;一&#xff09; Svg Flow Editor 原生svg流程图编辑器&#xff08;二&#xff09; Svg Flow Editor 原生svg流程图编辑器&#xff08;三&#xff09; Svg Flow Editor 原生svg流程图编辑器&#xff08;四&#xf…

边缘计算与云计算总结

一. EdgeGallery 简介 MEC场景下的EdgeGallery是让资源边缘化&#xff0c;实时完成移动网络边缘的业务处理&#xff0c;MEC场景下的EdgeGallery让开发者能更便捷地使用 5G 网络能力&#xff0c;让5G能力在边缘触手可及。 EdgeGallery是由华为、信通院、中国移动、中国联通、…

TheMoon 恶意软件短时间感染 6,000 台华硕路由器以获取代理服务

文章目录 针对华硕路由器Faceless代理服务预防措施 一种名为"TheMoon"的新变种恶意软件僵尸网络已经被发现正在侵入全球88个国家数千台过时的小型办公室与家庭办公室(SOHO)路由器以及物联网设备。 "TheMoon"与“Faceless”代理服务有关联&#xff0c;该服务…

Linux内核之最核心数据结构之一:struct file(三十)

简介&#xff1a; CSDN博客专家&#xff0c;专注Android/Linux系统&#xff0c;分享多mic语音方案、音视频、编解码等技术&#xff0c;与大家一起成长&#xff01; 优质专栏&#xff1a;Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 优质专栏&#xff1a;多媒…

ubuntu编译OpenCV and seetaFace2

opencv opencv-4.5.2 opencv_contrib-4.5.2 SeetaFace2 SeetaFace2-master https://github.com/seetafaceengine 指定安装目录&#xff0c;和OpenCV放一个目录下了 安装前 安装 安装后 Qt安装 Windows下 Linux下 报错1 原因&#xff1a; 报错…

Linux指令大全,第二篇(超详细版)

目录 9.1 链接文件的命令 10.1. 用户和权限 11.1 文件压缩和解压命令 12.1 文件操作命令补充 13.1 Vim编辑器的使用 14.1 Linux开关机命令 15.1 Shell Linux 程序设计&#xff08;未完持续更新~&#xff09; 16.1 以上运行效果图如下 9.1 链接文件的命令 9.1.1 …

ChatGPT与传统搜索引擎的区别:智能对话与关键词匹配的差异

引言 随着互联网的快速发展&#xff0c;信息的获取变得比以往任何时候都更加便捷。在数字化时代&#xff0c;人们对于获取准确、及时信息的需求愈发迫切。传统搜索引擎通过关键词匹配的方式为用户提供了大量的信息&#xff0c;然而&#xff0c;这种机械式的检索方式有时候并不…

鱼眼相机的测距流程及误差分析[像素坐标系到空间一点以及测距和误差分析]

由于最近在整理单目测距的内容&#xff0c;顺手也总结下鱼眼相机的测距流程和误差分析&#xff0c;如果有错误&#xff0c;还请不吝赐教。 参考链接: 鱼眼镜头的成像原理到畸变矫正&#xff08;完整版&#xff09; 相机模型总结&#xff08;针孔、鱼眼、全景&#xff09; 三维…

机器人是怎么计时的(通用定时器 - 时基单元)

目录 一&#xff0c;引言 二&#xff0c;机器人的“大脑” 三&#xff0c;时基单元介绍 1&#xff0c;定时器框图 2&#xff0c;时基单元 &#xff08;1&#xff09;预分频器 &#xff08;2&#xff09;CNT计数器 &#xff08;3&#xff09;自动重装载寄存器 四&#…

智慧管道物联网远程监控解决方案

智慧管道物联网远程监控解决方案 智慧管道物联网远程监控解决方案是近年来在智能化城市建设和工业4.0背景下&#xff0c;针对各类管道网络进行高效、安全、精准管理的前沿科技应用。它融合了物联网技术、大数据分析、云计算以及人工智能等多种先进技术手段&#xff0c;实现对管…

【MATLAB源码-第171期】基于matlab的布谷鸟优化算法(COA)无人机三维路径规划,输出做短路径图和适应度曲线

操作环境&#xff1a; MATLAB 2022a 1、算法描述 布谷鸟优化算法&#xff08;Cuckoo Optimization Algorithm, COA&#xff09;是一种启发式搜索算法&#xff0c;其设计灵感源自于布谷鸟的独特生活习性&#xff0c;尤其是它们的寄生繁殖行为。该算法通过模拟布谷鸟在自然界中…

Java Spring创建bean流程及自定义构造方法示例

一、spring容器创建bean的简单步骤 1、扫描被Service&#xff0c;Component等注解标识的类。 2、找到类的构造方法 默认使用无参构造方法构建bean&#xff0c;如果类中定义了有参构造方法则会按照有参构造方法构建bean。 3、依赖注入 如果类中存在Autowired或有参的构造方法&am…

如何使用PHP和RabbitMQ实现延迟队列(方式二)?

前言 前几天写了一篇关于PHP和RabbitMQ如何通过插件实现延迟队列的功能。 今天写另外一篇不需要插件的方式&#xff0c;使用RabbitMQ的死信队列&#xff08;Dead-Letter-Exchanges, DLX&#xff09;和消息TTL&#xff08;Time-To-Live&#xff09;。 这种方法涉及到设置消息…

记一次 .NET某防伪验证系统 崩溃分析

一&#xff1a;背景 1. 讲故事 昨晚给训练营里面的一位朋友分析了一个程序崩溃的故障&#xff0c;因为看小伙子昨天在群里问了一天也没搞定&#xff0c;干脆自己亲自上阵吧&#xff0c;抓取的dump也是我极力推荐的用 procdump 注册 AEDebug 的方式&#xff0c;省去了很多沟通…

[flink] flink macm1pro 快速使用从零到一

文章目录 快速使用 快速使用 打开 https://flink.apache.org/downloads/ 下载 flink 因为书籍介绍的是 1.12版本的&#xff0c;为避免不必要的问题&#xff0c;下载相同版本 解压 tar -xzvf flink-1.11.2-bin-scala_2.11.tgz启动 flink ./bin/start-cluster.sh打开 flink web…