CVPR-2018 那些有趣的新想法
Taylor Guo @ Shanghai - 2018.10.18
缘起
还有什么比顶级会议更适合寻找有趣新想法的地方吗?我们从CVPR 2018 计算机视觉和模式识别的顶级会议中发现了很多有趣的东西。
GAN和CV
寻找室外场景中的小脸

在沙特和中国研究人员的合作中,使用GAN来检测和放大人群照片上非常小的面孔。即使只是检测小脸,也是一个有趣的问题,常规的脸部探测器通常无法解决。这里,作者提出了一个端到端的方法来提取人脸,然后用生成模型将其提升4倍(一个称为超分辨率的过程)。
以下是主要流程:

PairedCycleGAN for Makeup

条件生产对抗网络已经广泛用于图像处理;刚才提到过超分辨率,生成对抗网络也成功进行了风格转换。使用GAN,可以学习与特定图像元素相对应的显着特征 - 然后更改它们! 普林斯顿,伯克利和Adobe的研究人员提出了一个修饰照片的架构。这项工作的一个有趣的部分是为不同的面部成分(眼睛,嘴唇,皮肤)训练单独的生成器并单独应用它们,用不同的网络提取面部成分:

GANerated Hands

位姿估计中的一个非常重要的子集(通常需要单独的模型)是手部跟踪。通过挥动双手来操纵计算机尚未完全实现,仍然需要专门的硬件,如Kinect。主要问题之一是数据:哪里可以找得到手部3D标记的真实视频流?这项工作,提出了一种条件生成对抗网络架构,能够将合成的3D手部模型转换为图像用于训练手部跟踪网络。合成数据是当下非常重要的工作之一,可以更详细地考虑它。如下是“从合成到真实”的生成对抗网络架构:

人员数据集风格转移GAN
Person Transfer GAN to Bridge Domain Gap for Person Re-Identification

人员重识别(ReID)是在不同条件和不同情况下拍摄的不同照片上找到同一个人的问题。这个问题自然而然引起了很多的研究,现在已经相对好理解,但是仍然存在一些问题:人物图像的不同数据集差异比较大啊(如 照明,背景等),在一个数据集上训练好的网络在迁移到另一个数据集(比如真实的应用场景中)时性能损失。上图就是展示了不同数据集的差异。为了解决这个问题,这项工作提出了一种GAN架构,能够将图像从一种“数据集风格”迁移到另一种“数据集风格”,使用GAN进行复杂变换,增强了实际数据。展示结果如下:

生成模型的眼睛图像合成
伦斯勒理工学院的这项工作处理一个非常具体的问题:生成人眼的图像。这不仅对于在生成的图像中制作漂亮的眼睛很重要,而且还可以使用生成的眼睛向后工作并解决凝视估计问题:人们在看什么?这将为通用人工智能接口铺平道路......这是未来,但目前甚至合成生成眼睛也是一个非常困难的问题。作者提出了一个用于合成人眼外形的复杂概率模型,提出了一个生成对抗网络架构,根据这个模型生成眼睛 - 取得了巨大的成功!

图像修复:填补空白区域

Adobe Research和伊利诺伊大学香槟分校的这项工作致力于填补图像空白区域的极具挑战性的问题(如上图所示)。通常,修复工作需要理解场景:上图右上角,必须知道脸部是什么样的,以及头发和颈部可能是什么样的。这项工作提出了一种基于GAN的方法,可以利用周围图像的特征来改进生成过程。该架构分两部分:先生成粗略结果,再用另一个网络进行细化。结果非常好:


CVPR-2018 那些有趣的新想法的更多相关文章
- 爬取CVPR 2018过程中遇到的坑
爬取 CVPR 2018 过程中遇到的坑 使用语言及模块 语言: Python 3.6.6 模块: re requests lxml bs4 过程 一开始都挺顺利的,先获取到所有文章的链接再逐个爬取获 ...
- 在矩池云上复现 CVPR 2018 LearningToCompare_FSL 环境
这是 CVPR 2018 的一篇少样本学习论文:Learning to Compare: Relation Network for Few-Shot Learning 源码地址:https://git ...
- Android L SDK -- 一些有趣的新功能
一些普通的就不提了,自己查看最新的文档就可以 文档地址 Task locking 功能:让我们在使用一个应用时,能够免受通知(消息)的打搅. 怎样使用:当我们在应用中激活任务锁模式.我们接收到的通知( ...
- JavaScript中对日期格式化的新想法.
其实我们对与日期的显示,也就那么几种,不需要每次都传格式化字符串. 只要告诉函数你想要什么结果就好了,以下是在ios的JavaScript中我新写的日期格式化函数: /** 格式化日期 @param ...
- CNN卷积神经网络新想法
近期一直在看卷积神经网络,想改进改进弄出点新东西来.看了好多论文,写了一篇综述.对深度学习中卷积神经网络有了一些新认识,和大家分享下. 事实上卷积神经网络并非一项新兴的算法.早在上世纪八十年代就已经被 ...
- UNITY相关的一些新功能,新想法
1,lua profiler for unity : https://github.com/ElPsyCongree/LuaProfiler-For-Unity 参考文章:https://blog.c ...
- CVPR 2018 DeepGlobe
在刚刚结束的CVPR2018: DeepGlobe Road Extraction Challenge(全球卫星图像道路提取)比赛中,北京邮电大学信息与通信工程学院模式识别实验室张闯老师指导的研究生周 ...
- NASNet : Google Brain经典作,改造搜索空间,性能全面超越人工网络,继续领跑NAS领域 | CVPR 2018
论文将搜索空间从整体网络转化为卷积单元(cell),再按照设定堆叠成新的网络家族NASNet.不仅降低了搜索的复杂度,从原来的28天缩小到4天,而且搜索出来的结构具有扩展性,在小模型和大模型场景下都能 ...
- CondenseNet:可学习分组卷积,原作对DenseNet的轻量化改造 | CVPR 2018
CondenseNet特点在于可学习分组卷积的提出,结合训练过程进行剪枝,不仅能准确地剪枝,还能继续训练,使网络权重更平滑,是个很不错的工作 来源:晓飞的算法工程笔记 公众号 论文:Neural ...
随机推荐
- MyBatis-Plus工具快速入门使用
MyBatis-plus有什么特色 1.代码生成 2.条件构造器 对我而言,主要的目的是使用它强大的条件构建器. 快速使用步骤: 1.添加pom文件依赖 <dependency> < ...
- mybatis——学习笔记
配置文件 <properties resource="dbconfig.properties"></properties> 1. properties 引入 ...
- 关于端口冲突的解决方式Error: listen EACCES 0.0.0.80
笔者昨天下午临走前安装了vs 2017想要运行一下项目的NET后端来让本机的前端直接对接后端,但是没注意到运行vs后IIS直接占用了本机的80端口.第二天跑nodeJS的时候直接Error: list ...
- 遗传算法详解及c++实现
1.什么是遗传算法? 遗传算法是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法.遗传算法是从代表问题可能潜在的解集的一个种群开始的,而一 ...
- C++笔记009:C++对C的扩展——“实用性”增加
原创笔记,转载请注明出处! 点击[关注],关注也是一种美德~ 笔记八中已经说到:在 C语言中定义了3个层次的作用域,即文件(编译单元).函数和复合语句. C语言中的变量都必须在作用域开始的位置定义! ...
- PHP中级程序员常见面试题
1).写一个函数,从一个标准url里取出文件的扩展名,需要取出php或.php <?php $a="http://www.test.com.cn:88/abc/de/fg.php?id ...
- 正则表达式-Regular expression学习笔记
正则表达式 正则表达式(Regular expression)是一种符号表示法,被用来识别文本模式. 最近在学习正则表达式,今天整理一下其中的一些知识点 grep - 打印匹配行 grep 是个很强大 ...
- CASE WHEN 批量更新
单个值: UPDATE categories SET display_order = CASE id WHEN 1 THEN 3 WHEN 2 THEN 4 WHEN 3 THEN 5 END WHE ...
- 『Linux基础 - 5 』Linux常用命令(2)
这篇笔记的只要知识点: (1)ls查看文件信息,列表中每个字符所代表的含义 (2) 使用通配符匹配文件 (3) chmod命令:修改文件或目录权限 (4) 与用户相关命令(who.su.exit.pa ...
- Java语法糖 : try-with-resources
先了解几个背景知识 什么是语法糖 语法糖是在语言中增加的某种语法,在不影响功能的情况下为程序员提供更方便的使用方式. 什么是资源 使用之后需要释放或者回收的都可以称为资源,比如JDBC的connect ...