Generating Faces with Deconvolution Networks

烤肠少女一米八 2024-10-11 01:52:27 原文

用深度学习做人脸合成，website：https://zo7.github.io/blog/2016/09/25/generating-faces.html

受启发于 Learning to Generate Chairs, Tables, and Cars with Convolutional Networks

模型描述

给定一个数据集

包含：c – the one-hot encoding of the model identity

v – azimuth and elevation of the camera position

Θ – the parameters of additional artificial transformations （增加训练集的数量，减少过拟合）

目标（the RGB output image x， the segmentation mask s）

网络结构

“1s-S-deep” model

生成网络模型由两阶段构成：

1. FC-1 to FC-4 建立一个分享的、高维的隐表达 h(c,v,Θ)

2. FC-5 and uconv-1 to uconv-4 （这部分定义为u）生成outputimage和segmentation mask

这个 deconvolution network类似于 here, here, or here，首先upsample输入，然后convolution。

该模型建立在Keras上。

网络训练

网络参数W

L_RGB（squared Euclidean）和L_segm（squared Euclidean/negative log-likelihood）是损失函数

用更理论的方法生成新模型，训练一个概率生成模型（FC-2）隐状态z：潜在的椅子图像集合

定义 a segmentation mask s_i under transformation T_Θi

定义the pixels in an image x_i

log likelihood of an image and its segmentation mask

网络分析

activating neurons of FC-1 and FC-2 feature maps 见下图(最左边是 setting all neurons of the layer

to zero，其余图像是activating one randomly selected neuron) 并没有太大变化

activating neurons of FC-3 and FC-4 feature maps ，出现视角和类的变化

Images generated from single neurons of the convolutional layers （From top to bottom: uconv-2,

uconv-1, FC-5 of the RGB stream）

接下来，将通过程序进一步理解该模型。

Generating Faces with Deconvolution Networks的更多相关文章

Deformable Convolutional Networks
1 空洞卷积 1.1 理解空洞卷积在图像分割领域,图像输入到CNN(典型的网络比如FCN)中,FCN先像传统的CNN那样对图像做卷积再pooling,降低图像尺寸的同时增大感受野,但是由于图像分割预 ...
CVPR 2017 Paper list
CVPR2017 paper list Machine Learning 1 Spotlight 1-1A Exclusivity-Consistency Regularized Multi-View ...
提高驾驶技术：用GAN去除(爱情)动作片中的马赛克和衣服
同步自我的知乎专栏:https://zhuanlan.zhihu.com/p/27199954 作为一名久经片场的老司机,早就想写一些探讨驾驶技术的文章.这篇就介绍利用生成式对抗网络(GAN)的两个基 ...
转置卷积&&膨胀卷积
Convolution arithmetic tutorial theano Convolution arithmetric github 如何理解深度学习中的deconvolution networ ...
AI：IPPR的数学表示-CNN稀疏结构进化（Mobile、xception、Shuffle、SE、Dilated、Deformable）
接上一篇:AI:IPPR的数学表示-CNN基础结构进化(Alex.ZF.Inception.Res.InceptionRes). 抄自于各个博客,有大量修改,如有疑问,请移步各个原文..... 前言 ...
场景分割：MIT Scene Parsing 与DilatedNet 扩展卷积网络
MIT Scene Parsing Benchmark简介 Scene parsing is to segment and parse an image into different image re ...
GAN生成图像论文总结
GAN Theory Modifyingthe Optimization of GAN 题目内容 GAN DCGAN WGAN Least-square GAN Loss Sensi ...
Generating Adversarial Examples with Adversarial Networks
目录概主要内容 black-box 拓展 Xiao C, Li B, Zhu J, et al. Generating Adversarial Examples with Adversarial ...
Classifying plankton with deep neural networks
Classifying plankton with deep neural networks The National Data Science Bowl, a data science compet ...

随机推荐

C++虚函数实现多态原理（转载）
一.前言 C++中的虚函数的作用主要是实现了多态的机制.关于多态,简而言之就是用父类型别的指针指向其子类的实例,然后通过父类的指针调用实际子类的成员函数.这种技术可以让父类的指针有"多种形态 ...
PostScript学习：另一种缩写为PS的技术
1.前言 PostScript是一种编程语言,直译为"后处理脚本"[相对印刷过程而言],学名为页面描述语言.更为详细的解释见维基百科,以及其翻译版百度百科. 值得一提的是,Post ...
LeetCode 476. Number Complement
Given a positive integer, output its complement number. The complement strategy is to flip the bits ...
关于VS2010编译警告LNK4221
最近研究duilib,准备把里面自定义的一些工具类如CDuiString什么的用ATL的替换掉,于是遇到久仰大名的 warning C4251: xxx needs to have dll-int ...
我喜欢的快捷键 webstorm
1.打开设置 ctrl+alt+s 2.重命名 rename ctrl+r
DevExpress的SpinEdit控件无法输入数字的问题
今天在发布程序后突然发现了这个问题,刚开始很莫名其妙的,因为在调试时从来没碰到过.然后经过测试发现,这个问题的原因和输入法有很大关系: 当你的输入法是中文状态时,是无法向框中输入数字的,此时只能点击上 ...
ViewPager和View的事件响应规则
案例背景: 当我们实现viewpager的自动切换界面操作的时候,如果需要增加点击图片viewpager停止自动切换,松开手指viewpager自动切换又继续执行的逻辑,正常思维下实现代码如下所示: ...
PHP静态延迟绑定和普通静态效率简单对比
只是一个简单的小实验,对比了下延迟绑定和非延迟的效率延迟绑定主要就是使用 static 关键字来替代原来的 self ,但功能非常强大了实验代码: class A { protected s ...
OpenGL杂七杂八
Projection Matrix 投影矩阵 3D -> 2D PFD_DOUBLEBUFFER 双缓冲在图形图象处理编程过程中,双缓冲是一种基本的技术.我们知道,如果窗体在响应WM_PAIN ...
利用Runtime给UITextView添加占位符(新方法)
以前一直使用自定义UITextView通过通知中心来自定义placeHolder,最近看到这个方法,感觉更好 UITextView *textView = [[UITextView alloc]in ...