机器学习: 基于MRF和CNN的图像合成

前面我们介绍了基于卷积神经网络的图像风格迁移，利用一张content image 和 style image，可以让最终的图像既保留content image的基本结构，又能显示一定的style image的风格，今天我们介绍另外一篇类似的文章： Combining Markov Random Fields and Convolutional Neural Networks for Image Synthesis，这篇文章与之前的 Image Style Transfer Using Convolutional Neural Networks 的区别在于引入了 Markov Random Fields，不再是像素的一一对应了，利用MRF，可以将feature maps 分成很多的patch，找 patch之间的匹配。

给定一张content image xc∈Rwc×hc 以及一张 style image xx∈Rws×hs，我们希望合成一张图像 x∈Rwc×hc, 将 style image的风格迁移到 content image 的 layout，并且利用 MRF 使得合成图像的 local patchs 与 style image 的类似，我们可以建立如下的能量函数：

E=Es(Φ(x),Φ(xs))+α1Ec(Φ(x),Φ(xc))+α2Υ(x)

我们需要求解上面的优化函数得到最优的 x

x=argminxEs(Φ(x),Φ(xs))+α1Ec(Φ(x),Φ(xc))+α2Υ(x)

Es 表示 style loss function，Φ(x) 表示神经网络中某些层里 feature maps 的一个集合，Ec 表示 content loss function，Υ(x) 是一个正则化选项，用来平滑最终的合成图像。接下来，我们可以看看每一个 loss function 的具体表达式：

Es(Φ(x),Φ(xs))=∑i=1m∥∥Ψi(Φ(x))−ΨNN(i)(Φ(xs))∥∥2

这里 m 表示Ψ(Φ(x)) 的基数，即local patch 的个数， Ψi(Φ(x)) 表示 Φ(x) 的一个local patch，而 ΨNN(i)(Φ(xs)) 表示 Φ(xs) 中与 patch Ψi(Φ(x)) 最匹配的一个 patch，即

NNi=argminj=1,2...msΨi(Φ(x))⋅Ψj(Φ(xs))|Ψi(Φ(x))|⋅|Ψj(Φ(xs))|

简单来说，就是将feature maps 的集合 Φ(x) 生成很多local patch，这些 local patch 组成一个 patch 的集合 Ψ(Φ(x))，在这个 patch 的集合中，每一个patch Ψi(Φ(x)) 在 Ψ(Φ(xs)) 都有一个最佳的匹配，Es(Φ(x),Φ(xs)) 计算的不是 pixel 之间的平方差，而是 patch 与 patch 之间的平方差，所有比起之前的图像合成算法，这个方法利用了MRF, 去寻找patch 与 patch 之间的关系，这样可以更好的保留局部的信息，但是算法也变得更加复杂。

content loss function 和之前的一样，计算feature maps 之间的欧氏距离:

Ec(x)=∥Φ(x)−Φ(xc)∥2

正则化选项的表达式如下：

Υ(x)=∑i,j((xi,j+1−xi,j)2+(xi+1,j−xi,j)2)

这个相当于在水平方向和垂直方向做差值。

将这三项结合起来，利用BP算法，求最终的合成图像 x.

机器学习: 基于MRF和CNN的图像合成的更多相关文章

基于Pre-Train的CNN模型的图像分类实验
基于Pre-Train的CNN模型的图像分类实验 MatConvNet工具包提供了好几个在imageNet数据库上训练好的CNN模型,可以利用这个训练好的模型提取图像的特征.本文就利用其中的 “im ...
FaceRank-人脸打分基于 TensorFlow 的 CNN 模型
FaceRank-人脸打分基于 TensorFlow 的 CNN 模型隐私因为隐私问题,训练图片集并不提供,稍微可能会放一些卡通图片. 数据集 130张 128*128 张网络图片,图片名: 1- ...
基于区域的CNN（R-CNN）
基于区域的CNN(R-CNN) Region-based CNNs (R-CNNs) 基于区域的卷积神经网络或具有CNN特征的区域(R-CNN)是一种将深度模型应用于目标检测的开创性方法.在本节中,将 ...
李宏毅机器学习笔记5：CNN卷积神经网络
李宏毅老师的机器学习课程和吴恩达老师的机器学习课程都是都是ML和DL非常好的入门资料,在YouTube.网易云课堂.B站都能观看到相应的课程视频,接下来这一系列的博客我都将记录老师上课的笔记以及自己对 ...
基于MatConvNet的CNN图像搜索引擎PicSearch
简介 Picsearch是一种基于卷积神经网络特征的图像搜索引擎. Github:https://github.com/willard-yuan/CNN-for-Image-Retrieval Web ...
基于pytorch的CNN、LSTM神经网络模型调参小结
(Demo) 这是最近两个月来的一个小总结,实现的demo已经上传github,里面包含了CNN.LSTM.BiLSTM.GRU以及CNN与LSTM.BiLSTM的结合还有多层多通道CNN.LSTM. ...
吴裕雄--天生自然 python数据分析：基于Keras使用CNN神经网络处理手写数据集
import pandas as pd import numpy as np import matplotlib.pyplot as plt import matplotlib.image as mp ...
基于卷积神经网络CNN的电影推荐系统
本项目使用文本卷积神经网络,并使用MovieLens数据集完成电影推荐的任务. 推荐系统在日常的网络应用中无处不在,比如网上购物.网上买书.新闻app.社交网络.音乐网站.电影网站等等等等,有人的地方 ...
基于TensorFlow理解CNN中的padding参数
1 TensorFlow中用到padding的地方在TensorFlow中用到padding的地方主要有tf.nn.conv2d(),tf.nn.max_pool(),tf.nn.avg_pool( ...

随机推荐

UVA 10943 - How do you add? 递推
http://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&p ...
以Spring整合EhCache为例从根本上了解Spring缓存这件事(转)
前两节"Spring缓存抽象"和"基于注解驱动的缓存"是为了更加清晰的了解Spring缓存机制,整合任何一个缓存实现或者叫缓存供应商都应该了解并清楚前两节,如果 ...
Snail—Hibernate之自写固定组件
Hibernate的存储都是在session中进行的,此session非彼session 以下就是从生成的Hibernate配置文件获得连接数据库,然后再得到session等等 package com ...
HDU 1496 Equations hash HDU上排名第一！
看题传送门: http://acm.hdu.edu.cn/showproblem.php?pid=1496 题目大意: 给定a,b,c,d.a*x1^2+b*x2^2+c*x3^2+d*x4^2=0 ...
28、应用调试之strace命令来跟踪系统调用
strace是个工具,在使用时需要先按照,见韦东山书籍: 1.tar xjf starce-4.5.15.tar.bz2 2.cd strace-4.5.15/ 3.patch -p1 < .. ...
Nginx+Tomcat搭建高性能负载均衡集群的实现方法
一. 目标实现高性能负载均衡的Tomcat集群: 二.步骤 1.首先下载Nginx,要下载稳定版: 2.然后解压两个Tomcat,分别命名为apache-tomcat-6.0.33-1和apac ...
使用RxPermissions（基于RxJava2）
使用RxPermissions(基于RxJava2) 0. 背景 Android 6.0 (API level 23)中.将权限分成了两类.一类是Install权限(称之为安装时权限).还有一类是Ru ...
Android入门——Bitmap和BitmapFactory
我们都知道一个App的成败,首先取决于是否具有优秀的UI,而除了交互功能之外还需要丰富的图片背景和动画去支撑.在开发中我们应用到的图片不仅仅包括.png..gif..9.png..jpg和各种Draw ...
ASP.NET MVC中实现多个button提交的几种方法
有时候会遇到这样的情况:在一个表单上须要多个button来完毕不同的功能,比方一个简单的审批功能. 假设是用webform那不须要讨论,但asp.net mvc中一个表单仅仅能提交到一个Action处 ...
1046: 找不到类型，或者它不是编译时常数: PieSeries
如题所看到的,出现提示,这个是绘图相关的错误:

机器学习: 基于MRF和CNN的图像合成

机器学习: 基于MRF和CNN的图像合成的更多相关文章

随机推荐

热门专题