DEX:从单一形象深刻地看待年龄

观看 人物研讨会国际计算机视觉大会(ICCV),2015
*获胜LAP面对年龄估计的挑战
* NVIDIA ChaLearn LAP 2015最佳论文奖

在本文中,我们通过深度学习来处理静态脸部图像的表观年龄估计。我们的卷积神经网络(CNN)使用VGG-16架构,并在ImageNet上预先进行图像分类。另外,由于有明显的年龄注明图像数量有限,我们探索了可用年龄的爬网式互联网面部图像的优势。我们从这个网站上公布的IMDb和维基百科的五百万个名人影像。这是迄今为止最大的年龄预测公共数据集。我们将年龄回归问题作为深度分类问题,随后是softmax预期值细化,并显示出对CNN的直接回归训练的改进。我们提出的方法,深度展望(DEX)的表观年龄,首先检测测试图像中的脸部,然后从裁剪面上的20个网络的集合中提取CNN预测。DEX的CNN在被抓取的图像上进行了分配,然后在提供的图像上进行了明显的年龄注释。DEX不使用显式的面部地标。我们的DEX是ChaLearn LAP 2015挑战赛(第一名),对明显的年龄估计,超过115个注册队伍,显着优于人类参考。 
我们的年龄估计模型正在我们的网站howhot.io上使用,它在互联网上传播,并广泛覆盖社会媒体和新闻界(TechcrunchHackernewsReddit#1Evening StandardSpiegel)。

PDF

从没有面部地标的单一形象深刻期待真实和明显的年龄

国际计算机视觉学报(IJCV),2016年

在本文中,我们提出了一种深度学习解决方案,从单一的面部图像来估计年龄,而不使用面部地标,并引入IMDB-WIKI数据集,这是面向年龄和性别标签的最大的公众数据集。如果真正的年龄估计研究跨越了数十年,则从脸部图像中观察年龄估计或其他人感觉到的年龄的研究是最近的一个尝试。我们通过对ImageNet进行图像分类预先训练的VGG-16架构的卷积神经网络(CNN)来处理这两个任务。我们将年龄估计问题作为深度分类问题,随后是softmax期望值细化。我们的解决方案的关键因素是:从大数据深入学习的模型,强大的面部对齐和年龄回归的预期值。

PDF

IMDB-WIKI数据集

据我们所知,这是最大的可公开提供的面部图像数据,具有性别和年龄标签进行培训。我们为年龄和性别预测提供预训模型。

描述

由于公开的面部图像数据通常是中小尺寸的,很少超过成千上万的图像,而且经常没有年龄信息,我们决定收集大量的名人数据。为此,我们列出了IMDb网站上列出的最受欢迎的十万名演员,并自动从他们的配置文件爬行,出生日期,姓名,性别以及与该人相关的所有图片。此外,我们使用相同的元信息从维基百科的人员页面中抓取了所有个人资料图片。我们删除了没有时间戳的照片(拍摄照片的日期)。假设具有单面的图像可能显示演员,并且时间戳和出生日期是正确的,我们能够为每个这样的图像分配生物(实际)年龄。当然,我们不能保证指定的年龄信息的准确性。除了错误的时间戳,许多图像仍然是电影 - 可以延长制作时间的电影。共有来自IMDb的20,284名名人和维基百科的62,328名,共获得了460,723张脸谱,共523,051张。

由于某些图像(特别是IMDb)包含了几个人,因此我们只使用第二个强大的脸部检测低于阈值的照片。为了使所有年龄段的网络得到同等的区别,我们要平衡培训的年龄分布。有关详细信息,请参阅论文。

用法

对于IMDb和维基百科图像,我们提供了一个单独的.mat文件,可以加载包含所有元信息的Matlab。格式如下:

  • dob:出生日期(Matlab序列号)
  • photo_taken:拍摄照片的年份
  • full_path:文件路径
  • 性别:女性为0,男性为1,NaN为未知
  • 名称:名人的名字
  • face_location:脸的位置。在Matlab运行中裁剪脸部
    IMG(face_location(2):face_location(4),face_location(1):face_location(3),:))
  • face_score:检测器得分(越高越好)。Inf意味着在图像中没有找到任何脸,而face_location则只返回整个图像
  • second_face_score:具有第二高分的脸部检测器分数。这对于忽略具有多个脸部的图像很有用。如果没有检测到第二面,则second_face_scoreNaN
  • celeb_names(仅限IMDB):所有名人名单的列表
  • celeb_id(仅限IMDB):名人名称的索引

一个人的年龄可以根据出生日期和拍照时间计算(请注意,我们假设照片是在年中拍摄的):

[年龄,〜] = datevec(datenum(wiki.photo_taken,7,1)-wiki.dob); 

下载图像和元数据

在这里,您可以下载原始图像和元数据。我们还提供一个版本与裁剪的面孔(40%的边缘)。这个版本要小得多。

我们注意到维基百科的一些图像是坏的。我们计划在未来解决这个问题。现在请忽略这些图像。

IMDB

WIKI

用边缘提取脸的代码

该代码允许用户以边缘提取脸部。对于我们预先训练的模型,我们在四面都使用了40%的宽度和高度的边距(默认设置)。在脚本的顶部有用于提取所有面部图像的样本代码。

下载Caffe模型

在本节中,我们为Caffe提供预先训练的模型。对于所有型号,我们使用从Mathias等获得的脸部40%的边缘脸检测器。对于年龄估计,输出层有101个神经元(0-100年,每年1个)。要获得预测的年龄,您需要在softmax归一化输出概率上取预期值。对于性别预测,输出层有2个神经元(女性为0,男性为1)。

注意:在训练模型时,我们使用Imagenet的意思

对IMDB-WIKI进行实时估算

该模型在IMDB-WIKI数据集上进行了培训。年龄分布平衡,被用作夏洛伊表观年龄估计挑战的预训练。

在LAP数据集上训练的表观年龄估计

*获得LAP挑战的明显年龄估计

此模型是以前型号的微调版本。该模型在ChaLearn表观年龄估计挑战的数据集上进行了微调。这些模型的合奏成为挑战的第一名(115队)。

性别预测

这个模型预测了一个人的性别。

引文

如果您正在使用数据集或预培训的模型,请添加引用。

@article {罗特-IJCV-2016,
作者= {Rasmus Rothe和Radu Timofte和Luc Van Gool},
title = {从没有脸部地标的单一图像深入预测真实和明显的年龄},
journal = {国际计算机视觉学报(IJCV)},
年= {2016},
月= {七月},
}
@InProceedings {罗特-ICCVW-2015,
作者= {Rasmus Rothe和Radu Timofte和Luc Van Gool},
title = {DEX:从单一图像深度预测明显的年龄},
booktitle = {IEEE国际计算机视觉研讨会(ICCVW)},
year = {2015},
月= {十二月}
}

执照

请注意,此数据集仅用于学术研究目的。所有的图像都是从互联网收集的,版权属于原始所有者。如果任何图像属于您,并且您希望将其删除,请通知我们,我们将立即将其从我们的数据集中删除。

IMDB-WIKI - 具有年龄和性别标签的500k +脸部图像的更多相关文章

  1. C#根据身份证号码,计算生日、年龄、性别

    朋友谈及身份证相关的信息,才了解到原来省份证号码中包含了年龄和性别. 这样在数据库中,就不必单独留字段存放它们了(不过,要根据具体情况来,要是读取频率较高,还是单独列出为好),这样顺带解决了年龄变更的 ...

  2. 基于安卓高仿how-old.net实现人脸识别估算年龄与性别

    前几段微软推出的大数据人脸识别年龄应用how-old.net在微博火了一把,它可以通过照片快速获得照片上人物的年龄,系统会对瞳孔.眼角.鼻子等27个“面部地标点"展开分析,进而得出你的“颜龄 ...

  3. 工作中遇到的问题——mysql关于年龄,性别的统计

    终于暂时闲下来了,一个项目加班加点一年多,前面太忙就顾不上博客了,慢慢的就懈怠了,最近算是暂时闲下来了,项目已经验收进入后期维护阶段,每天空余的时间也多了,想重新拾起博客,不求写什么高深的东西,以后就 ...

  4. Java中校验身份证号合法性(真伪),获取出生日期、年龄、性别、籍贯

    开发过程中有用的身份证号的业务场景,那么校验身份证的合法性就很重要了,另外还有通过身份证获取出生日期.年龄.性别.籍贯等信息, 下面是本人在开发中用到的关于校验身份证真伪的工具类,可以直接拿来使用,非 ...

  5. Excel提取身份证年龄和性别③

    问题场景 从user表中的身份信息中拿到用户的年龄和性别: 以下方法也可适用于提取其他数据,目的在于通过实例操作了解更多函数用法: 以下图中数据都为测试数据,不具备真实性! 场景一 从user表中的1 ...

  6. JavaScript 通过身份证号获取出生日期、年龄、性别 、籍贯

    JavaScript 通过身份证号获取出生日期.年龄.性别 .籍贯(很全) 效果图: 示例代码: //由于没有写外部JS,所以代码比较长!!! <!DOCTYPE html PUBLIC &qu ...

  7. python——进行年龄和性别检测

    年龄和性别检测 使用Python编程语言带你完成使用机器学习进行年龄和性别检测的任务. 首先需要编写用于检测人脸的代码,因为如果没有人脸检测,我们将无法进一步完成年龄和性别预测的任务. 下一步是预测图 ...

  8. 将wiki人脸数据集的性别信息提取出来制作标签

    import scipy.io as scio dataFile = 'D:\\Users\\a\\Documents\\Tencent Files\\178026882\\FileRecv\\wik ...

  9. js 通过身份证识别生日、年龄、性别

    <script>function IdCard(UUserCard,num){   if(num==1){       //获取出生日期       birth=UUserCard.sub ...

随机推荐

  1. 《快速开发》通过Maven创建WebService项目Hello World!

    有多快? 整个过程3分钟.不用下载jar包,不用一步一步创建Web Project... 你需要的就是在Maven库里选一个archetype,然后一路Next~ 先看结果: 准备好了吗?我们起飞: ...

  2. SharePoint中使用Global.asax

    Global.asax是ASP.Net应用程序的一个文件,用来处理Application级别的事情.可以添加自定义代码到这个文件,详细使用方式见 http://msdn.microsoft.com/e ...

  3. 【CF56E】Domino Principle(线性扫描,伪DP)

    每块多米诺骨牌所在的位置设为x,每块多米诺骨牌高度为h.如果将x位置上的多米诺骨牌向右翻到,它就可以影响[x+1, x+h-1]范围内的所有多米诺骨牌,让他们也翻到,同时这些被翻到的多米诺骨牌还能影响 ...

  4. 14深入理解C指针之---指针与内存分配

    一.内存的含义 1.定义:物理内存是固定,逻辑内存是非常灵活的 2.特征: 1).逻辑内存最终必须映射到物理内存才能作用 2).逻辑内存每次映射可能到不同的物理内存 3).逻辑内存与物理内存的链接通过 ...

  5. react-dnd 拖拽

    介绍 React DnD 是一组 React 高阶组件,可以用来帮你构建复杂的拖拽接口,同时解耦你的组件.React DnD 非常适合像 Trello 和 Storify 这样的应用,在不同地方通过拖 ...

  6. CSS-文本(中,英)

    1.缩进文本:text-indent 2.水平对齐:text-align:  left/center/right/justify(实现两端对齐文本效果) 3.字间隔:word-spacing(可以改变 ...

  7. (6)C#事务处理

    为了方便移到了ADO.NET分类里 事务的主要特征是,任务要么全部完成,要么都不完成 事务常用于写入或更新数据库中的数据.将数据写入文件或注册表也可以使用事物. ADO.NET不支持跨越多个连接的事物 ...

  8. NYOJ90 整数划分(经典递归和dp)

    整数划分 时间限制:3000 ms  |  内存限制:65535 KB 难度:3   描述 将正整数n表示成一系列正整数之和:n=n1+n2+…+nk,  其中n1≥n2≥…≥nk≥1,k≥1.  正 ...

  9. Spring Tool Suite(STS)安装

    Spring Tool Suite是一个基于Eclipse的开发环境,可以自定义用于开发Spring应用程序.它提供了一个随时可用的环境来实现,调试,运行和部署Spring应用程序,包括Pivotal ...

  10. Codeforces 553D Nudist Beach(二分答案 + BFS)

    题目链接 Nudist Beach 来源  Codeforces Round #309 (Div. 1) Problem D 题目大意: 给定一篇森林(共$n$个点),你可以在$n$个点中选择若干个构 ...