泊松流(Poisson Flow)生成模型

news/2024/4/19 20:51:51/文章来源:https://blog.csdn.net/qq_29788741/article/details/127453171

又搬来了神器啊~~~ 

扩散模型最早来源于物理中的热力学,最近却在人工智能领域大放异彩。还有什么物理理论可以推动生成模型研究的发展呢?最近,来自 MIT 的研究者受到高维电磁理论的启发,提出了一种称作泊松流(Poisson Flow)的生成模型。理论上,这种模型具有直观的图像和严谨的理论;实验上,它在生成质量、生成速度和鲁棒性上往往比扩散模型更好。本文已被NeurIPS 2022接收。

论文地址:https://arxiv.org/abs/2209.11178  

代码地址:https://github.com/Newbeeer/Poisson_flow

受到静电力学的启发,研究人员提出了一种新的生成模型,名为泊松流模型 (Poisson Flow Generative Models, or PFGM)。直观上,该研究可以把 N 维的数据点看成在 N+1 维空间中新增维度 z=0 平面上的一群正电荷,它们产生了高维空间中的电场。从 z=0 平面开始沿着它们产生的电场线往外走,该研究能够把样本送到一个半球面上(如图一所示)。这些电场线的方向对应于高维空间中泊松方程 (Poisson Equation)的解的梯度。研究人员证明了当半球的半径足够大的时候,电场线能够把在 z=0 平面上的电荷分布(也就是数据分布)转换为一个在半球面上的均匀分布(图二)。

PFGM 利用了电场线的可逆性来生成 z=0 平面上的数据分布:首先研究人员在大的半球面上均匀采样,接着让样本沿着电场线从球面往 z=0 平面运动,从而生成数据。由于沿着电场线的运动可以由一个常微分方程(ODE)描述,因此在实际的采样中研究人员只需要解一个由电场线方向决定的 ODE。通过电场,PFGM 将一个球面上的简单分布转换为一个复杂的数据分布。从这个角度来看,PFGM 可以被认为是一种连续的标准化流(Normalizing Flow)。

在图像生成实验中,PFGM 是当前在标准数据集 CIFAR-10 上表现最好的标准化流模型,取得了 2.35 的 FID score (图片质量的度量)。研究人员也展示了 PFGM 的其他一些用途,比如它能够计算图片的似然 (likelihood)、进行图片编辑和扩展到高分辨率的图片数据集上。此外,研究人员发现 PFGM 比近期大热的扩散模型 (Diffusion Models)有着三个优点

(1)在相同的网络结构上,PFGM 的 ODE 生成的样本质量远好于扩散模型的 ODE;(2)在与扩散模型的 SDE (随机微分方程)生成质量差不多的情况下,PFGM 的 ODE 达到了 10 倍 - 20 倍的加速;

(3)PFGM 在表达能力更弱的网络结构上比扩散模型鲁棒。


 

 哈哈 原来可以上传动图啊

图一:样本点沿着电场线运动 。上图:数据分布呈爱心状;下图:数据分布呈 PFGM 状

图二:左图:泊松场在三维中的轨迹;右图:在图像上使用 PFGM 的前向 ODE 和反向 ODE

方法概览

PFGM 的训练
 

该 ODE 通过减小 z,使得样本从大球面沿着电场线逐渐运动到 z=0 平面。此外,该研究提出了将大球面上的均匀分布投影到某个 z 平面以方便 ODE 模拟,并进一步通过变量替换来进一步加速采样。具体步骤请参见文章的 3.3 节。

实验结果

在表一中,该研究使用标准数据集 CIFAR-10 来评估不同模型。在该数据集上,PFGM 是表现最好的可逆标准化流模型,取得了 2.35 的 FID score。在使用相同的网络结构 (DDPM++/DDPM++ deep) 的条件下,PFGM 的表现优于扩散模型。研究人员同时观测到,在与扩散模型的 SDE (随机微分方程)生成质量差不多的情况下,PFGM 达到了 10 倍 - 20 倍的加速,更好地兼顾了生成质量与速度。此外,研究人员发现 PFGM 在表达能力更弱的网络结构上比扩散模型鲁棒,并且在更高维的数据集上依然优于同等条件下的扩散模型。具体请见文章的实验章节。在图三中,该研究可视化了 PFGM 生成图片的过程。

 

表一:CIFAR-10 数据上的样本质量(FID, Inception)与采样步数 (NFE)

 

 图三:PFGM 在 CIFAR-10, CelebA 64x64, LSUN bedroom 256x256 上的采样过程

结论

该研究提出了一个基于泊松方程的生成模型 PFGM。这个模型预测 N+1 维的扩展空间中的归一化电场线梯度,并通过电场线对应的 ODE 来采样。实验中,该研究的模型是当前最好的标准化流模型,并在相同的网络结构上取得了比扩散模型更好的生成效果与更快的采样速度。PFGM 的采样过程对噪声更鲁棒,也能扩展到更高维的数据集中。研究人员期望 PFGM 能够在其他应用领域中也能取得亮眼表现,比如分子生成和 3D 数据生成。  whaosoft aiot http://143ai.com  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_404493.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FDTD script command(源/监视器)

adddipole : 添加偶极子光源 addplane : 添加平面波 addindex : 添加折射率监视器 addmovie :添加电影监视器 addpower : 添加功率监视器 通用设置 设置结构名字 set("name",name);设置位置/跨度 set("x",1e-6);set("x span",1e-6); set(&q…

【软考中级信安】第三章--密码学基本理论

目录 1、密码学概况 1.1 密码学发展简况 1.2 密码学基本概念 1.3 密码安全性分析 2、密码体制分类 2.1 私钥密码体制(密钥不能公开) 2.2 公钥密码体制(密钥可以公开) 2.3 混合密码体制 3、常用密码算法 3.1 DES 3.2 …

【JAVA程序设计】(C00084)基于SSM+uniapp的社区疫情防控小程序及管理系统-有文档

基于SSMuniapp的社区疫情防控小程序及管理系统项目简介项目获取开发环境项目技术运行截图项目简介 基于后台ssm框架前台vue以及elementui框架小程序使用uniapp的社区疫情管控小程序及管理系统:系统管理员、用户 管理员角色包含以下功能: 首页、个人中心…

jmeter压力测试工具,雪崩效应,容错组件Sentinel

一。jmeter测试工具: 概念: 项目要上线,肯定是需要进行压力测试的 可以测试服务器够不够 场景: 一个问题,如果有服务接口被阻,那另一个接口是否会有影响 进而引出了jmeter,用来模拟线程压力下载…

YOLO性能指标

术语 全称 解释 True 表示推理正确 False 表示推理错误, 跟ground truth(位置,类别)比对之后得到的结论 positive 推理为正例,iou > 阈值,类别概率>阈值 negative 推理为反例,不符…

HarmonyOS系统中内核实现烟雾检测的方法

大家好,今天我们主要来聊一聊,如何使用鸿蒙系统来操作烟雾浓度传感器。 目录 第一:烟雾浓度传感器原理 第二: 鸿蒙相关API函数分析 Init_E53_SF1() MQ2_PPM_Calibration() Get_MQ2_PPM() 第三:硬件设计 第四&…

【单片机毕业设计】【mcuclub-hj-006-7】基于单片机的空气质量(天然气、CO、甲醛、甲苯、TVOC、CO2)检测的设计

最近设计了一个项目基于单片机的空气质量(天然气、CO、甲醛、甲苯、TVOC、CO2)检测系统,与大家分享一下: 一、基本介绍 项目名:空气质量(天然气、CO、甲醛、甲苯、TVOC、CO2) 项目编号&#x…

04 CSS01

目标: 1、基础认知 2、基础选择器 3、字体和文本相关样式 4、Chrome调试工具 5、综合案例 一、基础认知 1.1 css介绍 中文名:层叠样式表 作用:给页面中的html标签设置样式 1.2 css语法规则 css写在style标签中,style标签一般…

【DETR 论文解读】End-to-End Object Detection with Transformer

目录前言一、整体架构二、基于集合预测的损失函数2.1、二分图匹配确定有效预测框2.2、损失函数三、前向推理四、掉包版代码五、一些问题Reference前言 贡献/特点: 端到端:去除NMS和anchor,没有那么多的超参,计算量也大大减少&am…

二叉树的OJ练习题

1.单值二叉树 描述:如果二叉树每个节点都具有相同的值,那么该二叉树就是单值二叉树。只有给定的树是单值二叉树时,才返回 true;否则返回 false。 链接:965. 单值二叉树 - 力扣(LeetCode) 思路…

世界陶瓷卫浴100强榜单发布!

​  经过一年的严格数据审查,科学统计分析,备受全行业期待的 【世界陶瓷卫浴100强统计排行榜 】于2022年10月19日在中国佛山正式发布,除了陶瓷卫浴企业100强总榜以外,还发布了全球瓷砖企业30强、全球卫浴企业20强,全…

Python中的对象池是什么

在程序设计中,创建物体模块主要是通过生成对象来实现。当对象使用结束后,则会成为不再需要的模块进行销毁。 而在系统进行对象的生成与销毁过程中会大量的增加内存的消耗,同时对象的销毁往往会留下残留的信息,这样将会伴随内存泄露…

javaWeb SSM车辆调度系统myeclipse定制开发mysql数据库网页模式java编程SpringMVC

一、源码特点 JSP SSM车辆调度系统是一套完善的web设计系统,对理解JSP java编程开发语言有帮助,系统具有完整的源代码 系统采用SSM框架,系统主要采用B/S模式开发。开发环境为 TOMCAT7.0,Myeclipse8.5开发,数据库为Mysql5.0&a…

swagger动态开关实践

swagger动态开关实践1. 背景2. 配置文件监听2.1 基于注解2.2 基于jdk3. swagger改造3.1 bean刷新3.2 方法重写4. 总结5. 参考资料1. 背景 系统漏洞扫描,扫出了swagger的问题。这个问题其实比较基础,那就是生产环境不应该开启swagger! 但是&…

FreeRTOS 软件定时器的使用

FreeRTOS中加入了软件定时器这个功能组件,是一个可选的、不属于freeRTOS内核的功能,由定时器服务任务(其实就是一个定时器任务)来提供。 软件定时器是当设定一个定时时间,当达到设定的时间之后就会执行指定的功能函数&…

el-switch接口实现

后台返回的数据: active-textswitch 打开时的文字描述string——inactive-textswitch 关闭时的文字描述string——active-valueswitch 打开时的值boolean / string / number—trueinactive-valueswitch 关闭时的值boolean / string / number—falseactive-colorswi…

Enzo丨艾美捷Enzo Ciglitazone解决方案

艾美捷Enzo Ciglitazone是一种噻唑烷二酮类降血糖药。它在遗传性肥胖的C57 Bl/6 ob/ob小鼠中显示抗高血糖活性,并且是选择性PPARγ激动剂(EC50=3M)。抑制人间充质干细胞中HUVEC分化和血管生成,并刺激脂肪生成和减少成骨…

区块链 — Overview

文章目录区块链的概念区块链数据结构区块链的基础技术哈希运算数字签名共识算法智能合约P2P网络区块链分类公有链联盟链私有链区块链的概念 狭义上,区块链是一种按照时间顺序将数据区块以顺序相连的方式组合成的一种链式数据结构,并以密码学方式保证的不…

深度神经网络图像识别,深度神经网络图像配准

如何用Python和深度神经网络寻找相似图像 代码首先,读入TuriCreate软件包import turicreate as tc我们指定图像所在的文件夹image,让TuriCreate读取所有的图像文件,并且存储到data数据框data tc.image_analysis.load_images(./image/)我们来…

《python 可视化之 matplotlib》第一章 折线图 plot

《python 可视化之 matplotlib》第一章 折线图 本章节内容包括以下几方面内容: 绘制曲线 yx2yx^2yx2;让曲线更加光滑;常见的相关属性设置;多条折线图的绘制;折线图之间的颜色填充;时间序列可视化;常见问题…