【原创】梵高油画用深度卷积神经网络迭代10万次是什么效果？ A neural style of convolutional neural networks

作为一个脱离了低级趣味的码农，春节假期闲来无事，决定做一些有意思的事情打发时间，碰巧看到这篇论文： A neural style of convolutional neural networks，译作卷积神经网络风格迁移。这不是“暮光女”克里斯丁的研究方向吗？！连好莱坞女星都开始搞人工智能发paper，真是热的可见一斑！

这篇文章中讲述了如何用深层卷积神经网络来将一张普通的照片转化成一幅艺术风格的画作（比如梵高的星夜），可以看做是DL（deep learning）在NPR（非真实渲染non photography rendering）领域的一次革命（不难想象以后DL这种跨领域的革命会越来越多）。

论文地址：A Neural Algorithm of Artistic Style
项目地址：https://github.com/muyiguangda/neural-style

算法解析

（对算法不感兴趣的童鞋，可以直接跳过这一部分，看最终实验结果）

【总流程】

如上，a有个别名是conv1_1，b是conv2_1，依次类推，c，d，e对应conv3_1，conv4_1，conv5_1；输入图片有风格图片style image和内容图片content image，输出的是就是合成图片，然后用合成图片为指导训练，但是训练的对象不像是普通的神经网络那样训练权值w和偏置项b，而是训练合成图片上的像素点，以达到损失函数不断减少的效果。论文使用的是随机的噪声像素图为初始合成图，但是使用原始图片会快一点。

首先他定义了两个loss，分别表示最终生成的图x和style图a的样式上的loss，以及x和content图p的内容上的loss，α,β是调节两者比例的参数。最终的loss function是两者的加和。通过optimize总的loss求得最终的x。

所用的CNN网络是VGG-19，利用了它16个卷积层和5个pooling层来生成feature。实际指的是Conv+ReLU的复合体。

当然，使用其他pre-trained的model也是完全可以的，比如GoogLet V2，ResNet，VGG16 都是可以的（作者这哪是以VGG19为例）。

【内容损失函数】

l代表第l层的特征表示，p是原始图片，x是生成图片。
假设某一层得到的响应是Fl∈RNl∗Ml,其中Nl为l层filter的个数，Ml为filter的大小。Flij表示的是第l层第i个filter在位置j的输出。
公式的含义就是对于每一层，原始图片生成特征图和生成图片的特征图的一一对应做平方差

求内容损失函数梯度下降如下：

【风格损失函数】

F是生成图片的特征图。上面式子的含义：Gram第i行，第j列的数值等于把生成图在第l层的第i个特征图与第j个特征图分别拉成一维后相乘求和。

上面是风格损失函数，Nl是指生成图的特征图数量，Ml是图片宽乘高。a是指风格图片，x是指生成图片。G是生成图的Gram矩阵，A是风格图的Gram矩阵，wl是权重。

【总损失】

实验结果

下面是内容图，风格图，以及迭代10次，100次，500次，1000次，10000次，10万次的计算结果及分析：

【原图】

原图片如果尺寸过大，导致input层的batch size过大，会大大增加程序计算量（从而延长计算时间），容易引起程序不稳定，而对最终效果并没有明显提升，因此建议把图片尺寸尽量缩小（在像素不失真的前提下），推荐值：800 ppi x 600 ppi.

【风格图】

风格图不需要和内容图尺寸一致。可以适当裁剪，保留风格最突出的部分。

【迭代10次】

由于原始的输入是一张白噪声图片，因此，在迭代次数较少时，仍然没有形成内容图的轮廓。

【迭代100次】

天安门的轮廓初现

【迭代500次】

已经基本接近最终效果，既能看到天安门的形状，又有梵高“星夜”的线条风格和颜色搭配。

【迭代1000次】

500次到1000次，画面构成的变化已经不剧烈，基本趋于平稳。

【迭代500次，重复执行三次】

重复计算了三次，使用相同的图片，相同的卷积神经网络模型，相同的迭代次数（500次），却得到了区别明显的三张结果图。这是非常有意思的地方！

（a）（b）（c）

最近看完一本书，叫《随机漫步的傻瓜》，主要讨论随机性这个概念，随机性中隐藏着不可预测的风险，也蕴含着无限的可能性。没有随机变异，生物进化可能还处在单细胞阶段。

如果计算机只是一个工具，让它解一个方程组，如果已知数确定，计算条件确定，无论计算多少次，结果都是同一个。

这个例子中，结果出现了差异，说明这个系统中一定有随机的成分存在。

机器学习中随机性出现的部分通常如下：1. 训练样本的乱序操作；2. 随机梯度下降；3. 模型随机赋初始值。

本例中还多一条：初始输入的白噪声图像是随机生成的。

【迭代10000次】

可以看到画面右上部分，内容渐渐丢失，呈现灰色化。

推测原因：由于卷积神经网络中的若干pooling层，实际是对图像进行了均值处理，导致了边缘细节的丢失。

pooling层示意图：

那么，迭代10万次是什么样子的呢？

【迭代10万次】

画面朝着两极化趋势发展，灰色区域更加暗淡，彩色区域更加明亮，两者之间的界限更加分明，失去了过渡。

【原创】梵高油画用深度卷积神经网络迭代10万次是什么效果？ A neural style of convolutional neural networks的更多相关文章

【原创】梵高油画用深度卷积神经网络迭代十万次是什么效果？ A neural style of convolutional neural networks
作为一个脱离了低级趣味的码农,春节假期闲来无事,决定做一些有意思的事情打发时间,碰巧看到这篇论文: A neural style of convolutional neural networks,译作 ...
DeepLearning.ai学习笔记（四）卷积神经网络 -- week2深度卷积神经网络实例探究
一.为什么要进行实例探究? 通过他人的实例可以更好的理解如何构建卷积神经网络,本周课程主要会介绍如下网络 LeNet-5 AlexNet VGG ResNet (有152层) Inception 二. ...
[DeeplearningAI笔记]卷积神经网络3.10候选区域region proposals与R-CNN
4.3目标检测觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.10 region proposals候选区域与R-CNN 基于滑动窗口的目标检测算法将原始图片分割成小的样本图片,并传入分 ...
优化基于FPGA的深度卷积神经网络的加速器设计
英文论文链接:http://cadlab.cs.ucla.edu/~cong/slides/fpga2015_chen.pdf 翻译:卜居转载请注明出处:http://blog.csdn.net/k ...
基于theano的深度卷积神经网络
使用了两个卷积层.一个全连接层和一个softmax分类器. 在测试数据集上正确率可以达到99.22%. 代码参考了neural-networks-and-deep-learning #coding:u ...
深度卷积神经网络用于图像缩放Image Scaling using Deep Convolutional Neural Networks
This past summer I interned at Flipboard in Palo Alto, California. I worked on machine learning base ...
Deep Learning 19_深度学习UFLDL教程：Convolutional Neural Network_Exercise（斯坦福大学深度学习教程）
理论知识:Optimization: Stochastic Gradient Descent和Convolutional Neural Network CNN卷积神经网络推导和实现.Deep lear ...
深度学习——卷积神经网络的经典网络（LeNet-5、AlexNet、ZFNet、VGG-16、GoogLeNet、ResNet）
一.CNN卷积神经网络的经典网络综述下面图片参照博客:http://blog.csdn.net/cyh_24/article/details/51440344 二.LeNet-5网络输入尺寸:32 ...
深度学习之卷积神经网络(CNN)详解与代码实现（二）
用Tensorflow实现卷积神经网络(CNN) 本文系作者原创,转载请注明出处:https://www.cnblogs.com/further-further-further/p/10737065. ...

随机推荐

Python邮件发送源码
-- coding:utf-8 -- i = 0 while i < 10: #发送十次 import smtplib from email.mime.text import MIMEText ...
解决web网站被挂马清除方法
案例:某公司一个lamp的服务器网站站点目录下所有文件均被植入了广告脚本如下内容: <script language=javascriptsrc=http://%4%66E%78%72%67%2 ...
python-异常处理try_except
异常处理try-except 在我们写程序的时候经常会遇到一些异常或错误,导致程序终止当我们使用计算器时,用10除以0会提示一个简单的错误代码(10/0) a = 10 / 0 print(&qu ...
StringBuffer&StringBuilder类
0. 说明 1. 总体说明当对字符串进行修改的时候,需要使用 StringBuffer 和 StringBuilder 类. 和 String 类不同的是,StringBuffer 和 String ...
unity StrangeIoc
已经很久没有写博客,主要原因还是自我荒废了太久,在学习上失去了动力.最近来新的公司实习,以前都是做项目的开发,现在被调到框架组,主要从事的是框架维护还有开发.学习了许多新的知识还有优秀的框架,今天就写 ...
JAVA内存管理 [转]
首先我们要明白一点,我们所使用的变量就是一块一块的内存空间!! 一.内存管理原理: 在java中,有java程序.虚拟机.操作系统三个层次,其中java程序与虚拟机交互,而虚拟机与操作系统间交 ...
Oracle_spatial的空间操作符介绍
空间操作符一.主要空间操作符 1.SDO_FILTER SDO_FILTER(geometry1, geometry2, param); 判断两个几何体是否有相交 SELECT c.mkt_id, ...
table中怎么设置两行间距
table中设置两行间距方法: css代码实现 <style> table { border-collapse: separate; border-spacing: 1 ...
intellij IDEA软件java项目No SDK配置jdk开发，安装IDEA软件步骤
我们在使用intellij idea开发java项目的时候,我们在创建的时候会发现提示No SDK,影响创建和使用项目,我们需要下载和配置需要的JDK 电脑 1我们使用intellij idea创建j ...
【转】SVN branches trunk 合并讲解
转自:http://blog.csdn.net/e3002/article/details/21469437 使用svn几年了,一直对分支和合并敬而远之,一来是因为分支的管理不该我操心,二来即使涉及到 ...

【原创】梵高油画用深度卷积神经网络迭代10万次是什么效果？ A neural style of convolutional neural networks

【原创】梵高油画用深度卷积神经网络迭代10万次是什么效果？ A neural style of convolutional neural networks的更多相关文章

随机推荐

热门专题