27、CityNeRF

news/2024/5/4 6:54:31/文章来源:https://blog.csdn.net/weixin_50973728/article/details/126596977

简介

主页:https://city-super.github.io/citynerf/
在这里插入图片描述
CityNeRF能够将城市尺度的3D场景打包到一个统一的模型中,它能够保存从卫星到地面不等尺度的高质量细节。顶部:使用边缘颜色蓝色(L=1)、绿色(L=2)和橙色(L=3)来表示从最远到最近的三个等级,PSNR值显示在每个渲染图像的左上角。下图:CityNeRF甚至可以适应地球尺度的变化。

设计细节点

  • 带有残差块结构的增长模型:通过在每个训练阶段附加一个额外的块来增长模型,而不是单纯地深化MLP网络。每个块都有自己的输出头,预测连续阶段之间的颜色和密度残差,这鼓励块在更近的视图中关注新兴的细节
  • 包含多层次的数据监督:每个块的输出头由最远处尺度到对应尺度的图像进行联合监督。也就是说,最后一个块接受所有训练图像的监督,而最早的块只暴露于最粗尺度的图像

实现流程

在这里插入图片描述
观察NeRF上的伪影(a)在所有尺度上联合训练,(b)在每个尺度上单独训练。渲染图像上的工件用实框突出显示,真实图片显示在侧面。(a)在所有尺度上的联合训练导致近距离观察时纹理模糊,远距离观察时几何不完整;(b)在每个尺度上单独训练,在连续尺度之间产生不一致的几何和纹理。
在这里插入图片描述
(a)城市尺度场景的多尺度数据图解,其中使用L∈{1,2,3,…,}表示每个刻度。在每个阶段,模型与训练集同步增长。(b)随着训练的进行,新的残差块被附加到网络中,由从最遥远的尺度到当前尺度的样本联合进行监督。残差块的结构如虚线框所示。©在不同残差块上获得的细节级渲染结果。由浅到深,细节一点一点地增加

Challenges on City-scale Scenes

远景和近景之间巨大的空间覆盖差异导致了对中心场景内容的偏差,导致渲染图像的质量不一致,这是由于中心区域被摄像机在所有尺度上重复捕捉,而外围区域只被远处的摄像机观察到,虽然每个量表单独训练可以消除这种不一致性,但牺牲了不同量表之间的交流,导致连续量表之间的差异较大

PE中的有效频率通道在一个尺度到另一个尺度上是不同的,显示复杂细节的屋顶近景(L = 3),低频傅里叶特征(cos(25z))似乎不够,而高频傅里叶特征(cos(210z))被激活,以更好地对齐这些细节,远程视点(L = 1)可以很好地用低频傅里叶特征表示,因此高频傅里叶特征被抑制

在训练数据中近距离视角的数量有限,在所有规模上训练的NeRF往往会忽略这些高频场景组件,导致折中解决方案偏向于仅利用低频特征。

Progressive Model with Multi-level Supervision

在这里插入图片描述
(a)不同尺度的视图需要不同的傅里叶特征频率来恢复细节。高频傅里叶特征(如cos(210z))对于近景是必要的,低频傅里叶特征(如cos(25z))对于远景就足够了。(b)渐进训练策略在更深的区块(如B3)有效地激活了PE中提供的高频傅立叶特征,而普通的NeRF经常失败,即使在最深的跳跃连接之后。

在这里插入图片描述

论文采用渐进式的方法来建立和训练模型以应对城市尺度场景的多尺度特征带来的不同的样本难度

根据摄像机距离对训练数据进行分割,这近似于场景中物体的分辨率层次。

设置远处的视图(L = 1),Lmax为被捕获场景预先确定的训练阶段的总数,每个训练阶段都将纳入一个更近的L + 1尺度的视图,记为Lt(t∈1,2,……,Lmax)

这种数据输入方案允许模型在早期训练阶段将更多的精力放在外围区域,从而弥补了样本分布的偏差

同时构建一个粗略的场景布局,自然为后续训练阶段的近距离观察打下基础
在这里插入图片描述

随着训练集的扩展,模型通过添加新的块来增长,每个block与输出头配对,预测场景内容的颜色残差和密度残差,最遥远的视图被允许从只有基本颜色的浅块中退出,而特写视图必须由更深的块处理,并逐步添加剩余颜色渲染。PE通过一个跳跃连接注入到每个块中,以捕捉场景组件中出现的复杂细节。在整个训练过程中,网络中的所有层都是可训练的。

Residual Block Structure

在这里插入图片描述

远程视图(L=1)通常显示不太复杂的细节,因此使用一个Dres = 4,W=256个隐藏单元的浅层全连接层作为Bbase。第二层紧接在Bbase的后面(使用上一层的潜在特征ZL−1)由Dres = 2层非线性映射组成的块B2。每一层通过Hl(l∈1,2,……,Lmax)输出各层的颜色和密度。

每一层要输入与之匹配的PE,由于浅层与远程视图相匹配,特征被学习与低水平的细节相匹配,因此PE中只有低频通道被激活。然而,新的层次需要访问PE中的高频通道,以更近距离的视角构建新兴的细节。渐进式训练策略能够在更深的块上利用更高频率的傅里叶特征

这种设计有两个优点

  • 鼓励中间块集中于缺失的细节,并利用跳过连接提供的高频傅里叶特征
  • 使从后块获得的梯度平滑地流回早期块,并在近距离观察的监督下增强浅层特征

在这里插入图片描述

Inclusive Multi-level Supervision

在这里插入图片描述
在这里插入图片描述
为了保证在所有尺度上的一致渲染质量,在训练阶段L,输出头部HL由前一尺度图像的并集进行监督,即{It≤L}。将阶段L的损失加到从H1到HL之前所有的输出头上:
在这里插入图片描述
Rl是级指示器到级l的一组光线,C®为真实图像颜色, ˆ C®为预测图像颜色

多级监管的设计嵌入了细节层次的思想,更深入的输出头提供了渲染视图中更复杂的细节,将不同层次的细节统一到一个单一的模型中,并且可以用L进行控制

效果

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_3211.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

L73.linux命令每日一练 -- 第十章 Linux网络管理命令 -- dig和host

10.19 dig:域名查询工具 10.19.1 命令详解 ​ 【命令星级】 ★★★★☆ ​ 【功能说明】 ​ dig命令是常用的域名查询工具,可以用于测试域名系统的工作是否正常。 ​ 【语法格式】 dig [option] dig [选项]​ **说明:**在dig命令及后面…

Debian/Ubuntu/Kali 如何安装 Spotify 音乐白嫖神器

How to install Spotify on Debian/Ubuntu/Kali Linux 可能有小伙伴不了解,什么是Spotify?博主照搬维基百科来做 简要介绍: Spotify(/ˈspɒtɪfaɪ/),中文译作“声田”),是一家瑞典…

如何图片批量重命名编号不要汉字?

如何图片批量重命名编号不要汉字?如果你是一个摄影发烧友,或者你是一名从事摄影相关工作的朋友,那么肯定经常会将拍摄好的照片转移到电脑上,然后进行批量重命名。其实不管什么时候,我们经常会遇到图片批量重命名的操作…

group by后,使用nvl失效问题

原因 首先,这篇博客写出了这个问题出现的原因: 链接: nvl(sum(字段),0) 的时候,能展示数据0,但是group by 下某个伪列的时候,查不到数据(转载) 这里我也总结下原因:没有记录返回则…

使用Kibana进行数据可视化

使用 Kibana 进行数据可视化 使用 ELK 堆栈(Elasticsearch、Logstash 和 Kibana)和 Elastic Stack 的一部分 Kibana 可视化和分析数据。 课程英文名:Data Visualization with Kibana 此视频教程共21.0小时,中英双语字幕&#x…

[模拟][模电][面试][运放]仪表放大器

前言 昨天访问量还是29万1千多,今天就变成了28万3千,CSDN又在倒退了!!! 目录前言框图\;\\\;\\\;框图 虚短:放大器的正负输入假设短路,两个端口电位相同虚断:放大器的正负输入假设断…

Linux命令记录大全

至于为什么写下该篇博客 身为以为软件工程师平时在工作中会经常的使用Linux系统,久而久之会发现该系统比我们平时用的Windows系统有着巨大的优势,不管是从安全层面和可扩展层面。而Linux的命令可以说是非常的多并难以全部记住,所以我写下该片…

Hive 多数组合并 CONCAT_WS

目录 多列的情况 先上结果 拆分concat_ws 可以拆分数组 然后在用split切分再变回数组 多行合并 多列的情况 先上结果 select split(concat_ws(,,array("AAA", "bbb"), array(CCC,"AAA", "bbb"), array("GGG","…

react native 使用阿里字体图标库

前言 本文基于 “react-native”: “0.69.5” 版本。 1.下载iconfont图标文件 将iconfont图标文件放置在src/assets/fonts react native 所需的字体图标文件仅需iconfont.ttf这一个文件即可其余文件只是用于打开demo_index.html,打包时可将其余文件删除 2.链接字…

Java配置41-搭建Kafka服务器

目录 1.服务器环境 2.安装kafka 1)上传安装介质 2)解压安装 3)修改配置文件 4)启动zookeeper 5)启动kafka 6)测试 ​​​​​ 1.服务器环境 系统版本:Red Hat Enterprise Linux Server…

IC入行第一步:怎样选择岗位和公司?

IC行业是一个比较火的行业,不少人想要转行IC,但不知道该如何选择岗位和公司? 其实这得根据个人的学历和专业结合选择,转行之前一定要考虑清楚,不要盲从,毕竟入行是一件大事,得认真分析选择适合…

Java配置42-配置redis高可用(sentinel监控)

目录 1.服务器环境 2.Redis服务器概况 3.Redis高可用 1)复制配置文件 2)修改redis.conf 3)修改sentinel.conf文件 4)启动redis和sentinel 5)配置redis信息 1.服务器环境 系统版本:Red Hat Enterpri…

共话龙蜥:中国操作系统到底有没有角力世界舞台的实力?

操作系统是计算机的灵魂所在,更是现代社会数字经济转型的关键。随着国内科技力量的壮大,当出现如 CentOS 停服等机遇时,会进一步助推国内操作系统发展。如今国内开源操作系统遍地开花,我们到底有没有角力国际舞台的实力呢&#xf…

vue独立提供模板下载功能

需求描述:页面需要下载模板文件(word、excel),这些文件是固定的,如果存储在服务端,由后端负责返回数据流,前端再处理数据流则太浪费性能。把文件放到前端,用户下载时直接提供。但是传…

状态模式

抽奖活动问题 加入每参加一次抽奖活动要扣除用户50积分,中奖概率是10%奖品数量固定,抽完就不能抽奖活动有四个状态:可以抽奖,不能抽奖,发放奖品,奖品领完活动状态转换关系: 状态模式 基本介…

Application启动流程

我用的是安卓10版本,其他版本可能有差异,但是具体实现原理是一致的 Activity.java Android 的桌面本身也是一个 APP,为 Launcher。 当我们点击桌面的应用图标开始,就是 Launcher 中的一次点击事件: 1.Launcher pu…

驱动上下游高效协同,跨境B2B电商平台如何释放LED产业供应链核心价值

LED是发光二极管(Light Emitting Diode)的简称,属于一种化合物半导体组件。LED产业则是指涉及LED灯具上、中、下游各个相关行业的总称,由上游的外延片及LED芯片厂商、中游的LED封装以及下游照明应用领域组成。 图片来源:前瞻产业研究院 上游…

SpringCloud 下 MultipartFile 序列化(JSON)出错的解决方案

1、需求 在SpringCloud架构下,用户向客户端上传文件,客户端调用文件处理微服务去处理文件 2、问题 在客户端和文件处理服务间传递文件时,想直接把 MultipartFile 转为 json,但出现异常。 Servlet.service() for servlet [dispatch…

java教程之高性能并发计数器之巅峰对决

并发计数器各个方案介绍 方案概述 jdk5提供的原子更新长整型类 AtomicLongsynchronizedjdk8提供的 LongAdder 【单机推荐】Redisson分布式累加器【分布式推荐】 方案介绍 jdk5提供的原子更新长整型类 AtomicLong 在JDK1.5开始就新增了并发的Integer/Long的操作工具类Atomi…

UTONMOS:元宇宙链游之风、燎原之势

前言 2022年初以来市场迎来了大牛市,以GameFi为止的元宇宙链游项目因为基础设施的完善,开始走向大规模应用化。时至今日,GameFi市场早已经承载了不止千亿美金,但因为高门槛和高泡沫红利正在逐渐消散,而以元宇宙链游为…