图像修复论文阅读笔记------Image Inpainting for Irregular Holes Using Partial Convolutions

news/2024/5/2 19:28:25/文章来源:https://blog.csdn.net/hshudoudou/article/details/126624049

一、引言

不仅考虑了孔的大小,还考虑了孔是否与图像边界接触的影响。

为了正确处理不规则掩码,提出使用部分卷积层,包括掩码和重新归一化卷积操作,然后是掩码更新步骤。

论文的主要贡献

  1. 使用部分卷积和自动掩码更新步骤来实现图像修复;
  2. 第一个证明在不规则形状的孔上训练图像修复模型的有效性;
  3. 提出并发布了一个大型不规则掩模数据集

二、相关工作

三、 方法

提出的模型使用叠加部分卷积运算和掩码更新步骤来进行图像修复。

部分卷积层

将部分卷积运算和掩码更新函数共同称为部分卷积层。

部分卷积表示为:

其中,W为卷积滤波器的权重,b为相应的偏差。X是当前卷积(滑动)窗口的特征值(像素值),M是对应的二进制掩码,⊙ 表示逐元素乘法。

1具有与M具有相同的形状,但所有元素均为1。sum(1)/sum(M)是一个缩放因子,用来适当的缩放来调整有效(未屏蔽)输入的变化量。可以看出,输出值仅取决于未屏蔽的输入。

在每次部分卷积操作之后,将进行更新掩码:如果卷积能够根据至少一个有效的输入值调节其输出,则将该位置标记为有效。这表示为:

在充分连续应用部分卷积层的情况下,如果输入包含任何效像素,掩码最终都将是1。

网路结构

设计了一种类似于类似于UNet的架构,将所有卷积层替换为部分卷积层,并在解码阶段使用最近邻上采样。跳过链接(skip links)将分别连接两个特征图和两个掩码,作为下一部分卷积层的特征和掩码输入。最后一个部分卷积层的输入将包含带孔的原始输入图像和原始掩模的拼接,使得模型可以复制非孔像素。

在图像边界处使用具有适当掩蔽的部分卷积来代替典型的填充,这确保图像边界处的修复内容不会受到图像外部无效值的影响。

损失函数

L1损耗分别用于空穴像素和非空穴像素的网络输出:

Lhole=∣∣(1−M)⊙(Iout−Igt)∣∣1L_{hole} = ||(1 − M) ⊙ (Iout − Igt)||_1Lhole=∣∣(1M)(IoutIgt)1

Lvalid=‖M⊙(Iout−Igt)‖1L_{valid} = ‖M ⊙ (Iout − Igt)‖1Lvalid=M(IoutIgt)‖1

感知损失:

style损失

总变化(TV)损失

总损失Ltotal

四、实验

训练过程

在单个NVIDIA V100 GPU(16GB)上进行训练,批量大小为6。 ImageNet和Places2模型训练了10天,而CelebA HQ训练3天。所有微调均在一天内完成。

五、结论

局限性:无法处理一些稀疏结构的图像

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wUjiZnET-1661929106094)(C:/Users/Husheng/AppData/Roaming/Typora/typora-user-images/image-20220830220002686.png)]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_3861.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Centos7搭建sftp服务器,开启SFTP上报日志

需求:192.168.56.103服务器搭建sftp服务,配置sftp上报日志(类似vsftpd的/var/log/xferlog) 1、创建用户组sftpgroup,添加用户sftpuser(密码为123456,不可登录,上传目录为upload&…

计基于安卓 Android 微信小程序的孕妇产后康复系统app

关于产后修复文章 1:产后修复:女人第二次生命绽放 女性在一生中有三次机会可以调整自己的体型,那就是初潮期、 产后、更年期。而较重要的就是产后这个阶段,据调查,女性体内的 荷尔蒙等雌激素能使经历过生育这一过程的女性寿命增加十年。 这个时期,女人的身体就好像一个打开的大…

4G多协议转MQTT工业智能网关BL110之二:包装清单

在安装使用BL110设备之前,请确认产品包装盒里是否具备以下材料: (以下材料图片仅供参考,如有出入或革新,请以实物为准!) l 1XBL110网关 BL110工业智能网关整机 l 1x 输入电源的4PIN 3.5mm接线…

【Wordpress】docker环境下wordpress网站安装ssl/tls证书

目录 一、前言 (一)ssl/tls是什么? (二)docker的wordpress怎么下载? 二、正文 (一)docker环境的wordpress介绍 (二)配置步骤 1、加载Apache SSL模块 2…

初识react笔记

https://reactjs.org 官网 在开始前,请确保你的电脑安装了node,不知道装没装,就命令行工具node -v 一下 一:安装官方脚手架create-react-app 第一种npm install -g create-react-appcreate-react-app 项目名称 第二种npx create…

视频流PS打包方式详解

文章目录 视频流PS打包方式详解 1 PS流概述 2 PS封装格式 2.1 PES格式详解 2.2 PS头封装格式 2.3 PS system header封装格式 2.4 PSM封装格式 3 PS流整包发送和分包发送 1 PS流概述 PS流: Program Stream(节目流),简称PS流,将一个或多个分组但有共…

【python】计算mel频率可能比你想象的要复杂一点

Mel计算公式 计算mel频率可以直接套用公式, 公式如下, m2595log10(1f700)m 2595 log_{10}(1 \frac{f} {700}) m2595log10​(1700f​) 所以实现上如下 import numpy as np import librosadef mel_calculate(freq):return 2595 * np.log10(1freq/700)…

猿创征文|小而巧的API文档生成工具之smart-doc

文章目录smart-doc介绍smart-doc特性smart-doc的最佳搭档谁在使用smart-docsmart-doc的优缺点smart-doc和swagger区别比较smart-doc的使用姿势姿势一姿势二姿势三(公司内部推荐使用)总结smart-doc介绍 一个 java restful api 文档生成工具,不…

为了进大厂!吃透了各大厂最新 3000+Java 面试题,啃完面试肯定妥了!

在很多企业,都有 KPI 考核,然后在此基础上还会弄个“末位淘汰”( 或者叫“人员优化”)。互联网大厂残酷现状在此,无法避免,为了助力程序员朋友们跳槽面试、升职加薪、职业困境,提高自己的技术,逃脱掉“人员…

【翻译】A Closed-form Solution to Universal Style Transfer

通用风格迁移的闭式解决方案 文章目录Abstract1. Introduction2. Related Work3. 动机4. Method5. Results5.1. 定性结果5.2. 定量结果5.3. 更多结果5.4. 限制条件6. 结论Abstract 通用风格转换试图明确地将特征空间的损失降到最低,因此它不需要对任何预先定义的风…

牛视源码定制,抖音矩阵系统,别和谐啊、、、

抖音SEO内容如何制作? 现在网上有很多这种关于自己行业的一些数据分析的一些文章,大家可以去看一下。 所以看到这里,我们把做好抖音SEO需要的步骤其实也就四步,但是过程是需要不断的测试和优化。 四、SEO如何优化? …

配置本地Maven仓库——IDEA配置本地Maven源

Maven基础配置 现在大多数都是使用maven管理项目所需的资源文件,可是因为maven的远程仓库多数都很难下载,所以我们可以通过配置国内镜像,配置本地maven源。 1、下载maven maven下载链接 2、maven下载后是一个压缩包,直接解压即可…

利用HFSS-API设计指数渐变传输线

学个Antenna是以天线仿真和调试为主,理论原理为辅的干货天线技术专栏,包括天线入门知识以及各类天线的原理简介、仿真软件建模、设计、调试过程及思路。如有想看到的内容或技术问题,可以在文尾写下留言。 ​摘要: 上节学个Antenna…

纵横网络靶场 刷题记录

目录 Modbus协议 MMS协议分析 大工UDP协议 工控蜜罐日志分析 隐信道数据安全分析 工控安全取证 隐藏的黑客 Modbus协议 黑客通过外网进入一家工厂的控制网络,之后对工控网络中的操作员站系统进行了攻击,最终通过工控协议破坏了正常的业务。我们得…

Linux学习笔记

Linux安装在VM上 直接安装即可,或者打开VMX文件,挂载到VM上 Linux的目录结构 /代表根目录。~不同的用户,代表的目录不同。 超级管理员用户:root,终端中显示~,表示/root目录 普通用户:在hom…

手写一个泛型双向链表

前言 在当前大环境的背景下面试不问点算法都不算个合格的面试了(卷),而与算法紧密相关的数据结构也是经常问到的,像集合、链表、树、图、栈、堆、队列、矩阵 等等等等。 是不是感觉难度如下: 集合:有手就…

分布式缓存Hazelcast的部署及与SpringBoot整合使用

目录一、简介二、安装2.1 使用Docker形式部署2.2 客户端命令行2.3 Web管理页面三、与SpringBoot项目整合3.1 pom依赖3.2 配置类3.3 使用方式一、简介 官方文档:https://docs.hazelcast.com/hazelcast/latest/clients/java Github地址:https://github.com/hazelcast…

《MeInGame: Create a Game Character Face from a Single Portrait 》论文解读

一:论文干了件什么事 从单张图片生成一个游戏中的虚拟形象,且,论文的方法对光照强度,光照阴影遮挡等具有很好的鲁棒性,可以忠实还原肤色、妆容和皱纹等个性化细节。 摘要: 近年来,基于深度学习…

使用iptables动态映射Docker容器端口

0x0. 安装telnet telnet介绍:https://zh.wikipedia.org/wiki/Telnet 本文用于测试指定端口是否开放,命令如下: telnet [ip] [port]参数解释: ip:ip地址port:端口 如果指定端口开放则结果如下&#xff1a…

Libra论文阅读笔记-A unified congestion control framework for diverse application

目录一、Overview二、问题背景三、Libra方案overview四、Libra方案设计五、RL-based CCA算法总结论文题目:《A unified congestion control framework for diverse application preferences and network conditions》 CoNEXT’21 一、Overview 目前的拥塞控制算法(…