【基于冗余缩减变换:Pan-Sharpening】

news/2024/5/4 8:59:41/文章来源:https://blog.csdn.net/weixin_43690932/article/details/129948601

Pan-Sharpening Based on Transformer With Redundancy Reduction

(基于冗余缩减变换的全色锐化算法)
基于深度神经网络(DNN)的泛锐化方法已经产生了最先进的结果。然而,在全色(PAN)图像和低空间分辨率多光谱(LRMS)图像的共同信息没有得到充分的探讨。由于PAN和LRMS图像是从同一场景采集的,因此除了它们各自的独特信息之外,它们之间还存在一些共同信息。提取的特征的直接级联导致特征空间中的一些冗余。为了减少特征间的冗余,充分利用源图像的全局信息,提出了一种卷积神经网络与Transformer相结合的泛锐化方法。具体地,PAN和LRMS图像通过由卷积块和Transformer块组成的子网络被编码为独特特征和共同特征。然后,将共同特征平均并与来自源图像的独特特征组合以用于融合图像的重构。为了提取准确的共同特征,平等的施加约束在他们身上。实验结果表明,该方法优于最先进的方法在缩小规模和全尺寸的数据集。

介绍

星载成像传感器获取的遥感图像可以为观测场景提供丰富的空间和光谱信息。然而,在空间和光谱分辨率之间的权衡下,我们只能获得低空间分辨率的多光谱(LRMS)图像和全色(PAN)图像。为了产生高空间分辨率多光谱(HRMS)图像,采用全色锐化技术来融合LRMS和PAN图像以合成HRMS图像。
在过去的几十年中,已经提出了大量的泛锐化方法,它们可以分为四类:基于分量替换(CS)的方法、基于多分辨率分析(MRA)的方法、基于模型的方法和基于深度学习(DL)的方法。基于分量替换(CS)的方法,通过特定变换将LRMS图像分离为空间分量和光谱分量。然后,LRMS图像的空间分量被对应的PAN图像替换。最后,利用逆变换合成融合图像。基于MRA的方法,从PAN图像中提取空间细节,然后将其注入上采样的LRMS图像中以产生HRMS图像。与基于CS和基于MRA的方法不同,基于模型的方法假设LRMS和PAN图像分别是HRMS图像在空间域和谱域中的退化结果。HRMS图像是通过在各种先验的正则化下求解空间和光谱退化模型得到的。
近年来,基于深度神经网络(DNN)的泛锐化方法已被广泛研究,以利用DNN强大的非线性能力。例如,Masi等人首先提出了一种泛锐化神经网络(PNN),其中使用具有三层架构的卷积神经网络(CNN)来产生泛锐化MS图像。随后,通过引入不同的损失函数和残差学习,开发了一些高级版本的PNN。Cai和Huang构建了多尺度残差模块,以更好地保留HRMS图像中的空间结构。此外,Xu等人提出了一种基于梯度投影的PNN(GPPNN)。根据空间和光谱退化模型的优化策略设计网络。此外,生成对抗网络(GAN)也被认为是泛锐化任务。例如,Diao等人采用多尺度生成器和鉴别器之间的对抗游戏来生成HRMS图像。此外,Liu等人提出了一种双流融合网络(TFNet),用于提取PAN和LRMS图像中的特征。虽然双流网络可以有效地从源图像中提取的特征,从两个子网络的特征之间的冗余被忽略。由于PAN和LRMS图像是从同一场景捕获的,因此它们往往具有一些共同的特征,例如轮廓和形状。此外,由于PAN和LRMS图像是由不同的成像传感器获得的,因此它们也具有各自的特征。例如,LRMS图像的独特特征记录光谱信息。PAN图像中的空间细节可以被视为其独特的特征。根据分析,公共信息也将同时包含在从PAN和LRMS图像提取的子网络的特征。因此,公共信息在这些特性将导致信息冗余,这削弱了融合图像的质量。
此外,现有的基于CNN的泛锐化方法集中在PAN和LRMS图像中的局部结构的建模。最近,视觉变换器(ViT)已经被改进以通过利用自注意机制来探索图像中的全局属性,但是ViT 具有与图像大小成二次的计算复杂度。为了降低ViT的计算复杂度,提出了具有移位窗口的变换器(Swin Transformer),其中在局部窗口内实现自注意的计算。因此,Swin Transformer的计算复杂度与图像大小呈线性关系,目前正被用作许多计算机视觉任务的骨干。
为了减少子网络中特征间的冗余性,获取源图像的全局信息,提出了一种基于冗余减少变换器的泛锐化网络(TRRNet),该网络通过对公共信息的等式约束来实现。

贡献

1)我们利用CNN中的局部特征和变压器中的全局依赖性,设计了一个由卷积块和Swin Transformer块组成的新网络,用于PAN和LRMS图像的特征提取。
2)我们将每个源图像的特征图分为两部分:共同特征和独特特征。通过对来自PAN和LRMS图像的共同特征进行平均,减轻了特征之间的冗余。

方法

我们将LRMS图像和PAN图像分别表示为L ∈ Rh×w×BR^{h×w×B}Rh×w×B和P ∈ RH×WR^{H×W}RH×W。h和w是LRMS图像的空间大小。b是LRMS图像中的条带数。H = rh和W = rw。r代表LRMS和PAN图像之间的空间分辨率的比率。在基于DNN的泛锐化方法中,L通常被上采样到PAN图像的大小。上采样的LRMS图像由L ~ ∈ RH×W×bR^{H×W×b}RH×W×b表示。由于PAN图像和LRMS图像是从同一场景采集的,它们之间除了各自的独特信息之外,还存在一些共同的信息。根据这一假设,在特征空间中将PAN和LRMS图像划分为共同信息和唯一信息。我们将公式写成在这里插入图片描述
基于DNN的泛锐化方法使用DNN作为用于特征提取的非线性映射。然后,来自PAN和LRMS图像的特征被直接连接以用于HRMS图像的重建。然而,共同的信息都在PAN和LRMS图像的特征内。直接拼接会使PAN图像和LRMS图像的特征之间的共同信息在拼接后的特征中重复出现,导致特征之间的冗余。为了减少连接特征中的冗余,我们在特征空间中平均来自PAN和LRMS图像的公共信息,并将它们的唯一信息组合起来以生成HRMS图像。然后,公式被写为
在这里插入图片描述
因此,重要的是从PAN和LRMS图像中提取特征,并将其划分为公式下的共同和独特信息。

Network Framework

图1展示出了所提出的TRRNet的架构。如图1所示,设计了由卷积块和Swin Transformer块组成的两个子网络,以实现从PAN和LRMS图像中有效提取特征。建立重建网络Φ以生成期望的HRMS图像。在这里插入图片描述

PAN和LRMS图像共享相同的子网和网络参数。当通过相同的子网络从PAN和LRMS图像提取特征时,Swin Transformer块2的输出被整形以获得FPR(H/2)×(W/2)×BR^{(H/2)×(W/2)×B}RH/2×W/2×B和F~ LR(H/2)×(W/2)×BR^{(H/2)×(W/2)×B}RH/2×W/2×B。FP和F~ L分别对应于PAN和LRMS图像的特征。在所提出的TRRNet中,我们根据经验将FP划分为公共特征CPR(H/2)×(W/2)×(B/2)R^{(H/2)×(W/2)×(B/2)}RH/2×W/2×B/2和唯一特征UPR(H/2)×(W/2)×(B/2)R^{(H/2)×(W/2)×(B/2)}RH/2×W/2×B/2。对F~ L也进行同样的划分,得到共同特征C~ LR(H/2)×(W/2)×(B/2)R^{(H/2)×(W/2)×(B/2)}RH/2×W/2×B/2和唯一特征U~ LR(H/2)×(W/2)×(B/2)R^{(H/2)×(W/2)×(B/2)}RH/2×W/2×B/2。在本文中,假设PAN和LRMS图像在特征空间中共享相同的公共信息。因此,CP应该等于C ~ L,即在这里插入图片描述
在共同特征和独特特征的组合之后,级联特征被馈送到重构网络Φ中。该网络由两个Swin Transformer块和两个卷积块组成。级联上采样层以将特征内插到H × W的大小。最后,引入具有四个滤波器的卷积层以产生最终的融合结果。

Loss Function

当构建网络时,通过最小化以下损失函数来训练网络:
在这里插入图片描述
其中R是参考图像。α和β是折衷参数。在(7)中,μH和μR分别是H和R的平均值。σH和σR是相应的标准差。σHR是两个图像的协方差。C1和C2是预设常数。在(6)中,通过Frobenius范数来测量重构误差。结构相似性损失被认为是描述图像中的结构信息。所以,H和R之间的SSIM损失被用于更好地保存空间信息。根据Zhao等人的建议,(6)中前两项的权重分别设置为α和1-α。为了估计公共信息,将(5)中的等式约束投射在它们上。然后,可以准确地提取公共信息。

Implementation Details

在所提出的TRRNet中,所有卷积块由两个卷积层和两个Leaky ReLU层形成,如图1所示。所有过滤器的尺寸均为3×3。在卷积块1中,第一和第二卷积层包含4个和32个滤波器。卷积块2中的卷积层都包含64个滤波器。我们将卷积块3和4的所有卷积层中的滤波器的数量设置为96。重建网络中的最后一个卷积层包含四个滤波器。该层中的过滤器的数量与MS图像中的条带的数量一致。对于图1中的Swin Transformer块,头部的数量是4,并且头部尺寸是32。我们将Swin变换块中的窗口大小设置为8 × 8。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_283913.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python-Python基本用法(全:含基本语法、用户交互、流程控制、数据类型、函数、面向对象、读写文件、异常、断言等)

1 环境准备 编辑器:Welcome to Python.org 解释器:pycharm:Thank you for downloading PyCharm! (jetbrains.com) 2 Quick start 创建项目 new project create demo print(Dad!!)3 基本语法 3.1 print 直接打印 print(Dad!!)拼接打印…

AD20添加元件3D库

Altium Designer是画PCB常用的工具之一,为了PCB的美观性,我们可以采用3D的方式查看已经画好的PCB板。但在这之前需要准备好每个元器件的3D模型。 1、下载3D格式模型 http://www.3dcontentcentral.cn 当然要先注册账户。 在搜索栏输入你想要找的器件。 模型格式STEP AP214…

vue-cli 初始化工程

个人记录下vue-cli创建项目的步骤 卸载老版本的vue-cli (这不是必要的) npm uninstall vue-cli -g 如果本地使用 yarn的话,还需执行 yarn global remove vue-cli 安装全新的vue-cli npm install -g vue/cli 安装指定版本的vue-cli npm install -g vue/…

linux 安装git并拉取代码教程

#一步一步执行以下命令sudo apt install git #安装gitgit --version #查看安装版本号git config user.name jtr #设置用户名git config user.email jiangtrcloudskysec.com #设置邮箱ssh-keygen -t rsa -C "jiangtrcloudskysec.com" #生成秘钥,一直往下按…

自动化测试框架:DrissionPage(1)——安装与设置

发现了一款基于Python的网页自动化工具:DrissionPage。这款工具既能控制浏览器,也能收发数据包,甚至能把两者合而为一,简单来说:集合了WEB浏览器自动化的便利性和 requests 的高效率优点。 一、DrissionPage框架产生背…

【C++进阶】01:概述

概述 OVERVIEW概述C11新特性:C14新特性:C17新特性:C20新特性:C程序编译过程C内存模型CSTL1.Queue&Stack2.String3.MapC语言C语言面向过程编程✅✅面向对象编程(类和对象)❌✅泛型编程、元编程&#xff…

数据结构之七大排序

数据结构之七大排序🔆排序的概念及其运用排序的概念常见的排序算法🔆插入排序直接插入排序希尔排序🔆选择排序直接选择排序堆排序🔆交换排序冒泡排序快排🔆归并排序🔆非比较排序🔆结语&#x1f…

十二、Pytorch复现Residual Block

一、Residual Network 论文出处:Deep Residual Learning for Image Recognition 其核心模块: 二、复现Residual Block 这里以两层卷积层为例进行设计复现 resnet可以很好的解决梯度消失问题 Residual Block大致要点: 样本x传入模型&…

下一个“AI王炸”,别只盯着OpenAI,DeepMind也在憋大招

过去几个月,OpenAI风头无两,各大科技公司争先恐后地跟进大语言模型(LLM)这一技术路线。对比之下,OpenAI的老对手DeepMind,显得有些低调和沉默。微软靠OpenAI打了一场胜仗,而谷歌推出的Bard翻了车…

5.5G,运营商能接受吗?

2月份,我在巴塞罗那参加MWC 2023时有个发现。欧洲通信设备商大多在宣传和讨论6G相关技术,中国通信设备商却在重点展示5.5G,或者叫做5G-Advanced。而全球各国的运营商则都普遍处在比较观望的状态里,两头考察,多样化尝试…

中间表示- 到达定义分析

基本概念 定义(def):对变量的赋值 使用(use):对变量值的读取 问题:能把上图中的y替换为3吗?如果能,这称之为“常量传播”优化。 该问题等价于,有哪些对变量y…

OPNET Modeler 例程——创建一个移动无线网络

文章目录一、例程概述二、创建天线模型三、创建指向处理器四、创建节点模型1.发射机节点模型2.干扰发射机节点模型3.收信机节点模型五、创建网络模型六、收集统计量并运行仿真七、查看仿真结果总结一、例程概述 OPNET 无线模块支持地面和卫星无线系统的构建。在此例程中将构建…

【C++】基础篇

C基础篇什么是C命名空间命名空间的三种使用方式C的输入和输出缺省参数缺省参数分类函数重载引用引用的使用场景常引用指针和引用的区别auto关键字auto使用细则auto不能推导的场景基于范围的for循环范围for的使用条件指针空值nullptr什么是C 1982年,Bjarne Stroustr…

微服务+springcloud+springcloud alibaba学习笔记【Eureka服务注册中心】(3/9)

Eureka服务注册中心 3/91、服务注册与发现1.1 什么是服务治理:1.2 什么是服务注册与发现:1.3 Eureka服务注册与发现2、单机版eureka2.1 创建module2.2改pom依赖2.3写yml配置文件:2.4主启动类2.5 修改服务提供者 cloud-provider-payment8001 模块&#xf…

GFS的卷类型与集群实验文档

GlusterFS 支持七种卷,即分布式卷、条带卷、复制卷、分布式条带卷、分布式复制卷、条带复制卷和分布式条带复制卷。我们常用的有前五种,今天我们就来看一看这五种卷都有什么优缺点。 一、分布式卷(Distribute volume) 文件通过 H…

【模型复现】resnet,使用net.add_module()的方法构建模型。小小的改进大大的影响,何大神思路很奇妙,基础很扎实

从经验来看,网络的深度对模型的性能至关重要,当增加网络层数后,网络可以进行更加复杂的特征模式的提取,所以当模型更深时理论上可以取得更好的结果。但是更深的网络其性能一定会更好吗?实验发现深度网络出现了退化问题…

python玄阶斗技--tkinter事件

在前一篇文章中,我们已经了解是tkinter的一些标签的使用,但一个GUI程序除了让别人看到,还要有一些交互操作,实现人机交互的方法我们称为事件,通过事件分为:鼠标事件,键盘事件和窗口事件。接下来…

Neo4j初学者使用记录(在更)

打开Neo4j cmdR 输入neo4j console 浏览器中输入框中网址:http://localhost:7474/即可打开 新建库 服务器版需要更改配置文件,若neo4j服务正在运行,则按Ctrlc,停止该服务。 配置完后,再重新开启服务,刷新…

如何利用ventoy制作Linux to go (把deepin放到U盘里)

准备工作 最新版本 – 深度科技社区 (deepin.org) deepin镜像官方下载即可 Releases ventoy/vtoyboot GitHub ventoy启动插件选择1.0.29版本 Downloads – Oracle VM VirtualBox VirtualBox虚拟机官网 ventoy下载 VentoyRelease (lanzoui.com) 选择下载1.0.29版本 vento…

第五十八章 线段树(一)

第五十八章 线段树(一)一、树状数组的缺陷二、线段树的作用三、线段树的基本构成1、节点定义2、线段树的结构四、线段树的重要函数1、构造线段树——bulid函数2、查询区间——query函数3、单点修改——modify函数五、例题一、树状数组的缺陷 在前面两个…