【论文精读11】MVSNet系列(2018-2022)总结

news/2024/4/17 3:46:39/文章来源:https://blog.csdn.net/qq_41794040/article/details/129223755

MVSNet系列总结

      • 1.MVSNet ECCV2018
      • 2.RMVSNet CVPR2019
      • 3.P-MVSNet ICCV2019
      • 4.MVSCRF ICCV2019
      • 5.PointMVSNet ICCV2019
        • 2019年的这四篇文章各有特点,其中RMVSNet、PointMVSNet更是打开了可以继续沿着往下做的思路:
      • 6.cascade MVSNet CVPR2020
      • 7.UCSNet CVPR2020
      • 8.CVP-MVSNet CVPR2020
      • 9.Fast-MVSNet CVPR2020
      • 10.CIDER AAAI2020
      • 11.PVA-MVSNet ECCV2020
      • 12.D2HC-RMVSNet ECCV2020 Spotlight
        • 2020年涌现了很多优化的方法,整体来看有几篇文章的共同点有几个:
      • 13.Epp-mvsnet CVPR2021
      • 14.AA-RMVSNet ICCV2021
      • 15.Patchmatchnet CVPR2021
      • 17.RC-MVSNet ECCV2022
      • 18.Transmvsnet CVPR2022
      • 19.CDFSNet CVPR2022
      • 20.NP-CVP-MVSNet CVPR2022
      • 21.Vis-MVSNet IJCV2022

论文特点DTU(acc/com/overall)越低越好Tanks’mean(inter/advanced)越高越好
MVSNet(2018)开山之作0.396/0.527/0.46243.48
RMVSNet(2019)引入RNN,主打减少内存消耗(但时间增加)0.383/0.452/0.41748.40/24.91
PointMVSNet(2019)直接操作点云,同样减少内存消耗,时间增加不明显0.361/0.421/0.39148.27
P-MVSNet(2019)对卷积核做文章,使用特殊卷积核更好地在2D像素点周围、3D深度方向聚合信息0.406/0.434/0.42055.62
MVSCRF(2019)引入条件随机场来对深度图做平滑优化0.371/0.426/0.39845.73
cascade MVSNet(2020)使用2D UNet的多尺度图像特征,迭代更新深度推断的精度和尺寸0.325/0.385/0.35556.42/31.12
UCSNet (2020)使用2D UNet的多尺度图像特征,迭代更新深度推断的精度和尺寸(与UCSNet区别在使用不确定性图来决定下一次深度取值范围)0.338/0.349/0.34454.83
CVP-MVSNet(2020)使用图像金字塔,构建局部代价体,用类似PointMVSNet推断深度的残差累加到上一次迭代推断出的深度图上0.296/0.406/0.35154.03
Fast-MVSNet (2020)利用数学高斯牛顿迭代法来优化(待补充0.336/0.403/0.37047.39
CIDER (2020)不用方差构建代价体,而是引入特征图分组、内积计算相似度方法减小计算量和内存消耗0.417/0.437/0.42749.60/23.12
PVA-MVSNet(2020)使用2D UNet的多尺度图像特征,在方差法构建代价体时引入自适应视角聚合模块来考虑部分视图下对应特征被遮挡的情况(降低该特征图下该特征的权重)0.379/.0336/0.35754.46
D2HC-RMVSNet(2020)待补充0.395/0.378/0.38659.20
AA-RMVSNet(2021)使用可变形卷积核,同时也用PVA的策略考虑遮挡权重问题0.376/0.339/0.35761.51
PatchmatchNet(2021)多尺度由粗到细优化、组关联度、考虑视图间遮挡因素、可变卷积等,并且引入传播的概念来让各点试探周围同物体表面的深度值0.427/0.227/0.35253.15/32.31
RC-MVSNet (2022)待补充0.369/0.295/0.34555.04
Transmvsnet(2022)待补充0.321/0.289/0.30563.52
CDFSNet(2022)待补充0.352/0.280/0.31661.58
NP-CVP-MVSNet (2022)待补充0.356/0.275/0.31559.64
Vis-MVSNet(2022)待补充0.369/0.361/0.36560.03

1.MVSNet ECCV2018

在这里插入图片描述
作者Yao Yao,MVSNet系列的开山之作.

  • 构建了使用多张图像推断深度的MVSNet Pipeline:
    特征提取 - 单应变换 - 特征体 - 代价体 - 正则化 - 深度推断 - 后处理
  • 与传统方法相比:精度不如,但完整度更高
  • (截止2022年基于学习方法的精度还都比不上传统方法,但完整度上普遍较高)

2.RMVSNet CVPR2019

在这里插入图片描述

Yao Yao续作,将RNN引入MVSNet系列,开启用时间换空间的优化方向。

  • 在Pipline的正则化、深度推断、后处理三个部分做了优化:
    1.正则化:引入循环神经网络GRU模块在深度方向上逐步正则化(相当于时间方向)
    2.深度推断:看作多分类任务而非深度回归任务来处理
    3.细分优化深度图:解决多分类导致的阶梯现象(sub-pixel accuracy)
  • 相比MVSNet提高精度和完整度同时减少了内存消耗,相应的训练时长剧增。

3.P-MVSNet ICCV2019

在这里插入图片描述
在正则化部分做优化,主要特点在使用“向异性”的卷积核在空间上下文、深度方向上聚合信息,而不是单纯使用UNet来做。

  • 在Pipline的正则化部分做了优化:
    分别以patch和pixel为单位,引入各向异性的卷积核(即mxn型卷积核,如7x1,各向同性的为nxn型,如3x3),分别在空间上下文(2D周围方向,如用3x3x1卷积核)、深度(3D深度方向,如用1x1x7卷积核)聚合信息,优化原始的代价体以推断更准确的深度图
  • 相比MVSNet完整度损失降低,但精度损失略高,overall(精度、完整度损失之和的均值)更低

4.MVSCRF ICCV2019

在这里插入图片描述

待补充

5.PointMVSNet ICCV2019

在这里插入图片描述
在这里插入图片描述
为了避免在构建代价体部分所付出的巨大内存代价,选择直接在点云上进行操作
引入迭代多轮次优化深度推断的思想,使用“深度残差”思路,寻找各点预测深度与真实深度之间的差值并不断优化深度图。

  • 使用Pipline的基础上做了较大改动,引入了迭代优化的思想,并在点云上进行处理
    1.一个简单的MVSNet Pipline
    2.基于粗略推断的深度图构建出原始点云,并基于原始点云构建增强点云(以原始点云中各3D点为中心,沿深度方向前后各取一些假设点,即真实点可能在的位置),随后找到增强点云上3D点对应图片位置上的2D特征,构建各点的2D-3D混合特征;
    3.将2D-3D特征输入PointFlow模块,根据点云的局部结构特征对点云进行操作,最终输出的是深度残差图,即各点相对于原始推断深度的差值
    4.原始深度图+残差深度图获取新深度图,随后迭代2.3步骤
  • 相比MVSNet完整度、精度损失都有降低,且在内存消耗上减少,时间上略有增加

2019年的这四篇文章各有特点,其中RMVSNet、PointMVSNet更是打开了可以继续沿着往下做的思路:

论文特点DTU(acc/com/overall)越低越好Tanks(mean)越高越好
MVSNet开山之作0.396/0.527/0.46243.48
RMVSNet引入RNN,主打减少内存消耗(但时间增加)0.383/0.452/0.41748.40
PointMVSNet直接操作点云,同样减少内存消耗,时间增加不明显0.361/0.421/0.39148.27
P-MVSNet对卷积核做文章,使用特殊卷积核更好地在2D像素点周围、3D深度方向聚合信息0.406/0.434/0.42055.62
MVSCRF引入条件随机场来对深度图做平滑优化0.371/0.426/0.39845.73

6.cascade MVSNet CVPR2020

在这里插入图片描述

  • 在Pipline的特征提取、单应变换部分做了优化,并使用迭代优化思想:
    1.特征提取:使用2D Unet来提取不同尺度的特征供不同迭代轮次使用
    2.单应变换:在不同的迭代轮次,分别使用上一轮的深度推断图,基于各点的上一轮预测深度来更新本轮的深度采样区间,继续按pipline的方法构建代价体、推断深度图,从而使各点深度推断越来越精确
  • 相比MVSNet完整度、精度损失都有降低,且在内存消耗上减少,时间上略有增加

7.UCSNet CVPR2020

在这里插入图片描述

  • 在Pipline的特征提取、单应变换部分做了优化,并使用迭代优化思想:
    1.特征提取:使用2D Unet来提取不同尺度的特征供不同迭代轮次使用
    2.单应变换:在不同的迭代轮次,分别使用上一轮的深度推断图,基于各点的上一轮预测深度来更新本轮的深度采样区间(具体区间大小选择基于“不确定性估计”,即在上一轮次概率体推断深度图过程中,对每个像素点沿深度方向求方差,方差越小则确定性越高,下一轮次的深度区间选择可以越小),随后继续按pipline的方法构建代价体、推断深度图,从而使各点深度推断越来越精确
  • ps: 与同年的cascade MVSNet非常相似,对比来看cascade MVSNet在DTU上精度高,但完整度和overall低;cascade MVSNet在Tanks上mean更高,都没有完全超越对方所以都发表了。

8.CVP-MVSNet CVPR2020

在这里插入图片描述

  • 在Pipline的特征提取、代价体构建部分做了优化,并使用迭代优化思想:
    1.特征提取:使用特征金字塔来提取不同尺度的特征供不同迭代轮次使用
    2.代价体构建:在不同的迭代轮次,基于各点的上一轮预测深度获取对应初始3D点位置,并以该位置为中心,沿深度方向前后选取一些假设3D点(像素对应的真实3D点可能是初始的、也可能是我们选的这些存在Δd的假设点);
    将这些点深度值作为深度采样值,选取这些深度下的对应2D图像特征计算方差以构建局部代价体,随后通过正则化来得到各点的深度残差值(与上一轮深度图上各点深度的Δd)
  • ps: 与PointMVSNet的思想类似,都是推断残差深度;与cascade MVSNet类似之处在于都在不同迭代轮次使用不同的深度采样值,不同处在于cascade MVSNet每一轮使用pipline(在深度区间上直接均匀采样假设深度值)来推断完整深度图,而CVP-MVSNet是构建局部代价体(使用初始推断3D点深度方向附近的假设点来选取深度假设)进行推断残差深度图
  • 相比19年几篇在完整度、精度损失都有降低,输出深度图尺寸最大且时间消耗是最低,内存消耗相对也较少

9.Fast-MVSNet CVPR2020

在这里插入图片描述

10.CIDER AAAI2020

在这里插入图片描述

在Pipline的代价体构建、正则化部分做了优化:
1.代价体构建:单应变换之后不使用方差法,而是将特征图按通道分组,与参考视图对应通道做内积来计算相似度图构建代价体,减小了计算量和内存消耗
2.在正则化部分使用ResNet模块、两个3D Unet来进行正则化(论文指出该分组方法内存消耗小所以可以使用两个Unet,而之前的模型则不行)

在DTU数据集上表现一般(相比同2020年的几篇CVPR),但在Tanks上均值高且内存和时间消耗相对少

11.PVA-MVSNet ECCV2020

在这里插入图片描述

  • 在Pipline的特征提取、代价体构建部分做了优化:
    1.特征提取:使用2D Unet来提取特征
    2.代价体构建:使用了一个叫做自适应视角聚合(self-adaptive view aggregation)的模块来构建代价体:即在不同视图的特征体聚合为代价体时不是直接取平均值,而是根据各视图下各像素点特征与参考视图对应点特征相似程度来赋予权重(相似度高说明该像素点在两视图下均可见,因此该点的代价匹配权重应该高一些)

完整度损失明显下降,在tanks上表现也不错

12.D2HC-RMVSNet ECCV2020 Spotlight

在这里插入图片描述


2020年涌现了很多优化的方法,整体来看有几篇文章的共同点有几个:

  • 使用迭代优化思想,逐步提高推断深度图的尺寸和精度,以减少内存和时间消耗
  • 使用图像金字塔来提取并利用不同层次的深度图像特征、或是用可变形卷积核获取更有代表性的特征
  • 构建代价体时不是单纯的使用平均方差,而考虑用组内积衡量相似度、或是考虑遮挡情况下有些特征在某视角下不可见的情况(赋予不同权重)

13.Epp-mvsnet CVPR2021

14.AA-RMVSNet ICCV2021

在这里插入图片描述

  • 在Pipline的特征提取、代价体构建、正则化部分做了优化:
    1.特征提取:使用inter-view adaptive aggregation模块,使用可变形卷积核
    2.代价体构建:类似PVA-MVSNet的思想,使用intro-view adaptive aggregation
    3.正则化部分使用3D Unet与LSTM的混合正则化网络

完整度相比20年的文章又有提升,overall略不如;在tanks上提高较大

15.Patchmatchnet CVPR2021

在这里插入图片描述
在这里插入图片描述

  • PatchmatchNet使用了之前MVSNet中多种优化的技巧(多尺度由粗到细优化、组关联度、考虑视图间遮挡因素、可变卷积等),并且引入传播的概念来让各点试探周围同物体表面的深度值,详细见连接

精度不高,但完整度一下子提升很多;在tanks的高级数据集上也能进行并确定好结果。


待更新…

17.RC-MVSNet ECCV2022

18.Transmvsnet CVPR2022

19.CDFSNet CVPR2022

20.NP-CVP-MVSNet CVPR2022

21.Vis-MVSNet IJCV2022

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_75082.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python-GEE遥感云大数据分析、管理与可视化技术及多领域案例实践应用

随着航空、航天、近地空间等多个遥感平台的不断发展,近年来遥感技术突飞猛进。由此,遥感数据的空间、时间、光谱分辨率不断提高,数据量也大幅增长,使其越来越具有大数据特征。对于相关研究而言,遥感大数据的出现为其提…

Python基础—while循环

(1)while循环&#xff1a; 语法格式&#xff1a; while 条件&#xff1a;   执行语句1……   执行语句2…… 适用条件&#xff1a;无限循环 死循环 while True:print(条件是真的&#xff01;)代码实例&#xff1a; i 0 # 创建一个计数的变量 while i < 5: # Truepr…

一个容易被忽视的标签 —— iframe

前言 甲问&#xff1a;说说你知道的HTML标签。 乙于是说了一大堆标签&#xff0c;比如div&#xff0c;span等等。 甲说&#xff1a;那你知道 iframe 标签吗&#xff1f; 乙这时候迟疑了片刻&#xff0c;缓缓说出&#xff1a;知道它&#xff0c;但是不太了解这个标签。 HTM…

Linux文件属性--软连接和硬链接

文章目录软链接硬链接软链接和硬链接的区别软链接 软链接&#xff08;Soft Link&#xff09;又叫符号链接&#xff08;Symbolic Link &#xff09;&#xff0c;是linux特殊文件的一种&#xff0c;文件类型为l,它的数据是它所链接的文件或目录的路径。软链接可以跨磁盘和 分区…

动手学深度学习(第二版)学习笔记 第三章

第三章 线性神经网络 代码&#xff1a;d2l-zh/pytorch/chapter_linear-networks 3.1 线性回归 3.1. 线性回归 — 动手学深度学习 2.0.0 documentation 解析解 线性回归的解可以用一个公式简单地表达出来&#xff0c;这类解叫作解析解&#xff08;analytical solution&…

git在工作中的正常使用

开发A和B功能后进行发版。。 一、拉取代码 git clone http://ntc.ntsvars.com:8090/lvweijie/test.git二、开发功能A任务 创建A任务本地分支 #创建A分支&#xff0c;并切换A分支 git checkout -b A三、开发A任务 四、提交A功能文件到本地分支 git add .五、添加提交A功能备…

AcWing3485. 最大异或和

先看题目&#xff1a; 说实话&#xff0c;我看到这道题就想用滑动窗口&#xff0c;但是滑了一下发现不太对啊&#xff0c;如果我用滑动窗口的话&#xff0c;那么最后肯定是一个固定长度为m的窗口在持续计算&#xff0c;区间长度小于m的区间的异或和肯定会被遗漏。然后我就想怎么…

FSP:Flow of Solution Procedure (CVPR 2017) 原理与代码解析

paper&#xff1a;A Gift From Knowledge Distillation: Fast Optimization, Network Minimization and Transfer Learningcode&#xff1a;https://github.com/HobbitLong/RepDistiller/blob/master/distiller_zoo/FSP.py背景深度神经网络DNN逐层生成特征。更高层的特征更接近…

决策树在sklearn中的实现

目录 一.模块sklearn.tree 二.建模基本流程 三.DecisionTreeClassifier重要参数 1.criterion 2.random_state & splitter 3.剪枝参数max_depth 4.剪枝参数min_samples_leaf & min_samples_split 5.max_features & min_impurity_decrease 6.class_weight …

Python IDE:对于 Python 初学者来说,最好的 IDE 是什么?

Python 是科技界最简单、使用最广泛的编程语言之一。它是一种高级通用编程语言&#xff0c;强调代码可读性并使用面向对象的方法。Python可以用来完成很多任务&#xff0c;包括网站开发、软件开发、 自动化 和数据分析 专业开发人员使用Python开发各种流行的软件程序&#xff0…

深入理解Spring MVC上

Spring MVC 是一种基于 Spring 框架的 Web 框架&#xff0c;它提供了一种基于 Model-View-Controller&#xff08;MVC&#xff09;的设计模式&#xff0c;用于构建 Web 应用程序。在 Spring MVC 中&#xff0c;Controller 接受并处理 HTTP 请求&#xff0c;并将其转发给适当的 …

多表left join 慢sql问题

作为个人记录&#xff0c;后续再填坑a对p是1对多 ,p对llup 1对多SELECTa.id,p.id,t1.id FROMliv_series_product aINNER JOIN liv_product p ON p.id a.product_idLEFT JOIN ( SELECT llup.id, llup.product_id, llup.room_id FROM liv_live_user_product llup WHERE llup.ro…

Tomcat部署及多实例

Tomcat部署及多实例一、Tomcat简介1、Tomcat核心组件2、什么是JSP二、Tomcat数据流向1、Tomcat数据流向2、Tomcat-Nginx数据流向三、Tomcat服务部署安装1、安装jdk包2、解压Tomcat所需的安装包3、在/etc/profile添加环境变量4、启动服务并查看5、在浏览器网页验证6、创建用户&a…

为什么硬件性能监控很重要

当今的混合网络环境平衡了分布式网络和现代技术的实施。但它们并不缺少一个核心组件&#xff1a;服务器。保持网络正常运行时间归结为监控和管理导致网络停机的因素。极有可能导致性能异常的此类因素之一是硬件。使用硬件监控器监控网络硬件已成为一项关键需求。 硬件监视器是…

优化知识管理方法丨整理零碎信息,提高数据价值

信息流时代&#xff0c;知识成集合倍数增长&#xff0c;看似我们学习了很多知识&#xff0c;但知识零碎无系统&#xff0c;知识之间缺乏联系&#xff0c;没有深度&#xff0c;所以虽然你很努力&#xff0c;但你发现自己的能力增长特别缓慢&#xff0c;你需要整理知识将零散的知…

蓝桥杯:染色时间

蓝桥杯&#xff1a;染色时间https://www.lanqiao.cn/problems/2386/learning/?contest_id80 问题描述 输入格式 输出格式 样例输入输出 样例输入 样例输出 评测用例规模与约定 解题思路&#xff1a;优先队列 AC代码(Java)&#xff1a; 问题描述 小蓝有一个 n 行 m 列…

std::chrono笔记

文章目录1. radio原型作用示例2. duration原型&#xff1a;作用示例3. time_point原型作用示例4. clockssystem_clock示例steady_clock示例high_resolution_clock先说感觉&#xff0c;这个库真恶心&#xff0c;刚接触感觉跟shi一样&#xff0c;特别是那个命名空间&#xff0c;太…

vue2 diff算法

diff是什么 diff 算法是一种通过同层的树节点进行比较的高效算法 其有两个特点&#xff1a; ♥比较只会在同层级进行, 不会跨层级比较 ♥在diff比较的过程中&#xff0c;循环从两边向中间比较 diff 算法的在很多场景下都有应用&#xff0c;在 vue 中&#xff0c;作用于虚拟 dom…

预备2-CMD常用命令

CMD常用命令 先学简单常用的, 其余的要用在学 打开Cmd窗口 Win键R> 输入Cmd回车鼠标点击开始 > 附件>Cmd打开一个窗口,在地址栏输入cmd 操作目录 1.dir 查询当前目录有哪些文件 2.cd.. 上一级目录 3.cd e: 切换到E盘 4.d: 直接去d盘 5.cd /d e:abc 直接去E盘的abc目…

2023年房地产行业研究报告

第一章 行业发展概况 房地产业是指以土地和建筑物为经营对象&#xff0c;从事房地产开发、建设、经营、管理以及维修、装饰和服务的集多种经济活动为一体的综合性产业&#xff0c;是具有先导性、基础性、带动性和风险性的产业。主要包括&#xff1a;土地开发&#xff0c;房屋的…