Diffusion Model扩散模型

1、扩散模型基本原理：

扩散模型包括两个步骤：

固定的（或预设的）前向扩散过程q：该过程会逐渐将高斯噪声添加到图像中，直到最终得到纯噪声。

2.可训练的反向去噪扩散过程pθ：训练一个神经网络，从纯噪音开始逐渐去噪，直到得到一个真实图像。

正向过程
首先，对于一张原始图片，我们给加一个高斯噪声，图片由变成x1。【注意：这里必须要加高斯噪声，因为高斯噪声服从高斯分布，后面的一些运算需要用到高斯分布的一些特性】,重复上述添加高斯噪声步骤，直到图片变成xn，由于添加了足够多的高斯噪声，现在的近似服从高斯分布（又称正态分布）。
每一步添加高斯噪声的量一直是不变的吗？答案是每步添加高斯噪声的量是变化的，且后一步比前一步添加的高斯噪声更多。我想这一点你通过上图也非常容易理解，一开始原图比较干净，我们添加少量高斯噪声就能对原图产生干扰；但越往后高斯噪声量越多，如果还添加一开始少量的高斯噪声，那么这时对上一步结果基本不会产生任何影响。【注：后文所述的每个时刻图像和这里的每一步图像都是一个意思，如时刻图像表示的就是这个图像】

逆向过程

首先，我们会随机生成一个服从高斯分布的噪声图片，然后一步一步的减少噪声直到生成预期图片。

正向过程实现细节

正向过程其实就是一个不断加噪的过程，后一时刻的图像主要由两个量决定，其一是上一时刻图像，其二是所加噪声量。可以用一个公式来表示时刻和时刻两个图像的关系，如下：

其中，Xt表示t时刻的图像，Xt-1表示t-1时刻图像，Z1表示添加的高斯噪声，其服从N(0,1)分布。【注：N(0,1)表示标准高斯分布，其方差为1，均值为0】

其实，还和另外一个量有关：

其中，是预先给定的值，它是一个随时刻不断增大的值，论文中它的范围为[0.0001,0.02]。既然越来越大，则越来越小，越来越小，1−越来越大。

公式4得到了什么——其得到了时刻图像和时刻图像的关系。按照我们先前的理解，我们再列出时刻图像和时刻图像的关系，如下：

很明显的规律，这里我就根据这个规律直接写出时刻图像和时刻图像的关系，公式如下：

实际上就是，通过一次次的迭代太慢了，且每一次添加的噪声都独立且满足正态分布，正态分布相加还是正态分布，所以推导出了公式7

逆向过程实现细节
逆向过程是将高斯噪声还原为预期图片的过程。我们希望将时刻的高斯噪声变成时刻的图像，是很难一步到位的，因此我们思考能不能和正向过程一样，先考虑时刻图像和时刻的关系，然后一步步向前推导得出结论呢。

这里我们需要利用正向过程中的结论，我们在正向过程中可以由时刻图像得到时刻图像，然后利用贝叶斯公式即可求解。贝叶斯公式的表达式如下：

那么我们将利用贝叶斯公式来求时刻图像，公式如下：

公式8中我们可以求得，就是刚刚正向过程求的嘛。但和是未知的。又由公式7可知，可由得到每一时刻的图像，那当然可以得到和时刻的图像，故将公式8加一个作为已知条件，将公式8变成公式9，如下：

知道了公式9等式右边3项服从的分布，我们就可以计算出等式左边的。这个计算很简单，没有什么技巧，就是纯算。在附录->高斯分布性质部分我们知道了高斯分布的表达式为：。那么我们只需要求出公式9等式右边3个高斯分布表达式，求出µ和σ，然后进行乘除运算即可求得。

网络训练流程

我们最终要训练的实际上是一个噪声预测器。神经网络输出的噪声是，而真实的噪声取自于正态分布，则损失函数为：

高斯分布性质
高斯分布又称正态分布，其表达式为：

其中为均值，为方差。若随机变量服从正态均值为，方差为的高斯分布，一般记为。此外，有一点大家需要知道，如果我们知道一个随机变量服从高斯分布，且知道他们的均值和方差，那么我们就能写出该随机变量的表达式。

高斯分布还有一些非常好的性质：

Diffusion Model扩散模型的更多相关文章

一文详解扩散模型：DDPM
作者:京东零售刘岩扩散模型讲解前沿人工智能生成内容(AI Generated Content,AIGC)近年来成为了非常前沿的一个研究方向,生成模型目前有四个流派,分别是生成对抗网络(Gene ...
A Neural Influence Diffusion Model for Social Recommendation 笔记
目录一.摘言二.杂记三.问题定义和一些准备工作四.模型真思想五.实验部分六.参考文献一.摘言之前协同过滤利用user-item交互历史很好的表示了user和item.但是由于用户行为的 ...
Hugging Face 每周速递: 扩散模型课程完成中文翻译，有个据说可以教 ChatGPT 看图的模型开源了
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新.社区活动.学习资源和内容更新.开源库和模型更新等,我们将其称之为「Hugging Ne ...
Model Validation(模型验证)
Model Validation(模型验证) 前言阅读本文之前,您也可以到Asp.Net Web API 2 系列导航进行查看 http://www.cnblogs.com/aehyok/p/344 ...
008.Adding a model to an ASP.NET Core MVC app --【在 asp.net core mvc 中添加一个model （模型）】
Adding a model to an ASP.NET Core MVC app在 asp.net core mvc 中添加一个model (模型)2017-3-30 8 分钟阅读时长本文内容1. ...
Box Model 盒子模型
Box Model盒子模型,是初学者在学习HTMl5时会学到的一个重要的模型,也有一些人称它为框模型,因为盒子是属于3维,而框是平面的.称之为盒子模型,是因为其结构和盒子十分相似,其最外面是margi ...
Consistency Models终结扩散模型
最近看到一篇论文,觉得特别有意思,并且在学术界引起了不小的动静,他就是一致性模型,据说图像生成效果快.质量高,并且还可以实现零样本图像编辑,即不进行一些视觉任务训练,可以实现图像超分.修复.上色等功能 ...
Maximum Entropy Model(最大熵模型)初理解
0,熵的描述熵(entropy)指的是体系的混沌的程度(可也理解为一个随机变量的不确定性),它在控制论.概率论.数论.天体物理.生命科学等领域都有重要应用,在不同的学科中也有引申出的更为具体的定义, ...
CSS Box Model 盒子模型
1. 介绍 1.1 什么是 Box Model 在HTML中的每个element(元素)都可以看作一个矩形的盒子,矩形从内到外依次由元素的内容(content).内边距(padding).边框(bor ...
Keras Model Sequential模型接口
Sequential 模型 API 在阅读这片文档前,请先阅读 Keras Sequential 模型指引. Sequential 模型方法 compile compile(optimizer, lo ...

随机推荐

这才叫 API 接口设计！
API 接口设计 Token 设计 Token 是服务端生成的一串字符串,以作客户端进行请求的一个令牌,当第一次登录后,服务器生成一个 Token 便将此 Token 返回给客户端,以后客户端只需带上 ...
C# 异步执行操作
为了方便测试异步,先加个计时计时相关(可以直接跳过该部分) //开始计时 Stopwatch stopwatch = new Stopwatch(); stopwatch.Start(); // 停 ...
JDK17和JDK8在windows上同时安装方便切换
参考:https://blog.csdn.net/chencaw/article/details/121674479 一.JDK8的安装 1.电脑上已经安装了JDK8,安装主要步骤如下 (1)创建JA ...
Prometheus + Grafana 搭建监控系统
前言本文主要记录下如何使用 Prometheus + Grafana 搭建对各种服务的性能监控,涵盖对 Prometheus.Grafana 的基本介绍,以及如何使用二者进行对 Linux.MySQ ...
R3300L, Q7 ATV Android9固件
R3300L, Q7 ATV Android9固件固件来源 https://www.znds.com/tv-1239603-1-1.html 之前在恩山上发布过1080p安卓6固件 https:// ...
前端三件套系例之HTML——HTML5基础
1.HTML 1-1 什么是HTML HTML是用来制作网页的标记语言 HTML是Hypertext Markup Language的英文缩写,即超文本标记语言 HTML语言是一种标记语言,不需要编译 ...
Python正则表达式——常用re正则表达式集合
文章目录一.校验数字的表达式二.校验字符的表达式三.特殊需求表达式一.校验数字的表达式数字:^[0-9]*$ n位的数字:^\d{n}$ 至少n位的数字:^\d{n,}$ m-n位的数字:^ ...
oracle命令3 冷备份
用户管理的备份:备份脚本要自己写:备份哪些文件要自己选:恢复时要复制那些文件自己判断:恢复需要的日志,自己找: 备份,需要备份保存关键SCN信息的文件:一次完成的备份包括:控制文件,数据文件,日志文件 ...
Emit 实体绑定源码开源，支持类以及匿名类绑定（原创）
动态实体绑定主要有以下两种 1.表达式树构建委托 2.Emit构建委托根据我的经验 Emit 代码量可以更少可以很好实现代码复用 Emit实践开源项目地址跳转 https://www.cnblog ...
Java服务总在半夜挂，背后的真相竟然是...
写在前面最近有用户反馈测试环境Java服务总在凌晨00:00左右挂掉,用户反馈Java服务没有定时任务,也没有流量突增的情况,Jvm配置也合理,莫名其妙就挂了问题排查问题复现为了复现该问题,写 ...

Diffusion Model扩散模型

网络训练流程

Diffusion Model扩散模型的更多相关文章

随机推荐

热门专题