StartDT AI Lab | 视觉智能引擎——从Face ID说起，浅析顾客数字化

“顾客就是上帝”，这句西谚揭示了顾客占据着商业活动中心地位这一客观规律。为了能更好地服务顾客，优化商家自身的服务与产品，对顾客的分析与需求调研一直是商业经营分析中的重中之重。

在商业互联网化、社会数字化的今天，这一规律越发明显。从Web1.0时代开始，Cookie就被发明出来，用以对“顾客”进行数字化描述和建档并归一化其互联网下的数字行为。

其后的Web2.0时代，随着移动互联网的发展，个人生活中的屏—人机交互端口变多了，原先用Cookie对 “顾客” 进行数字化的方式已无法完成对个人全渠道全平台跨屏的行为归一化，为了解决这一问题，设备ID、SuperID应运而生。

当前， Web3.0正如火如荼地发展中，渠道、平台、终端、屏幕随着IOT的发展，通过云端赋能，下沉雾化，对“顾客”进行数字化描述的方式又迎来了更复杂更严峻的挑战。有鉴于此，奇点云与众多有志于此的友商，在多年前就开始了对于新形态“顾客ID”的预研。目前基本达成的共识有两点:

IOT时代来临，原来的线下物理社会逐步数字化上线，对于这一开放的数字化环境，已经难以通过唯一有限的媒介数字设备对顾客及行为数字化。这就需要从自然人身上直接数字化并抽取。

这一新形态数字ID需要能够较为高效和准确地拉通原先Web1.0和Web2.0时代的既有数字化信息。

在经历了一段时间摸索后，以人脸生物特征为基础的Face ID方案逐渐显露出优势，而 Face ID也成为了当前奇点云商业智能化方案中对于顾客数字化描述的主要技术方案。基于此，StartDT AI Lab在人脸数字化方向上做了充分且深入的技术沉淀。下面就为大家展示几点:

人脸数字化的核心自然是人脸识别，其包含了人脸生物特征的数字化和准确比对。作为视觉智能引擎中不可或缺的一部分，StartDT AI Lab的人脸识别技术可以解决复杂场景下的人脸识别问题。

比如动态视频监控场景下的人脸识别，相较于约束场景下的人脸验证所需的人脸识别技术，其一大挑战是对无约束人脸的识别，难度在于进行人脸识别的人脸图一般会存在模糊、遮挡、低分辨率、面部光照及表情变化巨大等，这些因素都会在一定程度上对人脸识别造成影响，甚至大幅降低人脸识别的准确率。而StartDT AI Lab对这种场景下的人脸识别准确率进行专项课题攻坚，主要研发采用了下面一些技术手段:

01数据增强

当训练数据面临样本量过少、质量分布不均衡或者训练集与实际场景分布差异较大时，模型的泛化能力会严重下降，此时数据增强就很有意义；StartDT AI Lab通过GAN网络同时结合传统图像处理技术，进行样本合成增强。

02图像处理

在无约束场景下，一般获取的图像质量较差，例如对人脸而言，一般分辨率较差、模糊、遮挡、低光等，StartDT AI Lab通过结合传统方法和深度学习方法，对人脸图像进行去噪、去模糊、超分辨等处理，从而获得更高质量的人脸图片，提升实际场景模型准确性。

03大规模分布式并行训练

采用多机多卡的训练方式，StartDT AI Lab目前支持上百万个ID，上亿张照片规模的训练数据集。

正所谓有矛就有盾，有攻就有防。自从有了数字ID，就有了对应的黑客技术来破解盗用数字ID，这一问题到了Face ID时代依然存在，并且因为Face ID所在的是开放性数字场景，攻击手段更是丰富简便了起来。

比如仅仅使用一个手机上的照片或者使用换脸APP就盗用了别人的人脸从而被认证，这样就非常容易被犯罪分子利用，人脸识别的应用范围就大打折扣了。因此，我们需要在人脸识别进行前增加活体检测加以应对。目前，人脸识别的主要攻击方法包括照片与视频回放攻击以及立体面具攻击。

我们在产品中针对不同的应用场景开发了多种活体检测方法，针对无人零售场景，需要配合交互验证的方式对用户不友好，同时需要控制成本，因此我们开发了基于单目RGB的静默活体检测方法。主要通过深度学习方式提取特征以及基于多特征融合的方法达到了目前场景下99.98%拒绝率，99.8%的通过率。目前算法已用在我们的多种场景下，时刻为我们的人脸识别系统保驾护航。

（已集成在产品上的活体检测演示）

在完成Face ID的提取之后，作为数字化需求的自然延展，视频智能引擎对人脸的相关信息也同步进行了数字化，例如年龄性别表情等。

目前，人脸年龄预测方面主要的难点在于如何协调年龄的连续性、年龄间的次序性、年龄分段的模糊性等，还有来自于实际场景中妆容、光照、角度等等的影响。

在人脸性别预测方面，主要问题在于intra-class variability，所以加大光照，角度等intra-class方面的增强数据有助于提升模型性能。

在人脸表情识别方面，碰到的难点主要有3方面:

各模式(光照，姿态等)下表情数据集不足；
由于年龄、性别、种族、表情强度等因素不同造成high inter-subject variations；
由于光照、姿态、遮挡等因素造成的large intra-class variability。

目前StartDT AI Lab选择的年龄性别表情预测与识别算法在以上问题的解决方面有了很大的突破，再通过大数据样本的训练，取得了相较于目前市面上主流人脸年龄性别表情API更高的性能指标。

通过以上的技术展示，相信读者对奇点云视觉智能引擎中的人脸相关技术能力有了一定了解，也对Face ID为主的Web3.0时代的“顾客”数字化描述这一主要方式有了一定认识。从目前奇点云在Web3.0的实践来看，Face ID在头部20%高净值VIP客户的服务中能有充分的数字化保障，这也直接提高商家在商业模式中80%预期收益的落袋能力。然而对于剩下20%的预期收益，由于其分散在80%长尾客群的稀疏商业行为中，如何以低成本的方式提高这部分预期收益的落袋向来是商业场景中的难点。有鉴于此，奇点云从技术的角度解构了这部分商业场景，并通过技术的一次次突破，不断地提升着预期收益的上限。而这背后的技术细节和故事正是本栏目下一期分享的主题，敬请期待！

StartDT AI Lab | 视觉智能引擎——从Face ID说起，浅析顾客数字化的更多相关文章

StartDT AI Lab | 视觉智能引擎+数据决策引擎——打造商业“智能沙盘”
众所周知,线上商家可以通过淘宝平台的大量前端“埋点”轻松获取商品的加购率.收藏率.转化率.成交额等大量基础信息,甚至商家能够在更精细的层面,获取商品关键字变化或者上新/爆款带来的流量变化数据,更甚者商 ...
StartDT AI Lab | 视觉智能引擎——Re-ID赋能线下场景顾客数字化
人货场的思路是整个新零售数字化链路的核心,人是整个业务生命周期的起始点,图像算法的首要目标就是从图像中得到“人” .前一篇我们主要讲了Face ID的发展,Face ID帮助商家赋能了线下用户画像,把 ...
StartDT AI Lab | 视觉智能引擎之算法模型加速
通过StartDT AI Lab专栏之前多篇文章叙述,相信大家已经对计算机视觉技术及人工智能算法在奇点云AIOT战略中的支撑作用有了很好的理解.同样,这种业务牵引,技术覆盖的模式也收获了市场的良好反响 ...
StartDT AI Lab | 需求预测引擎如何助力线下零售业降本增效？
在当下经济明显进入存量博弈的阶段,大到各经济体,小到企业,粗放的增长模式已不适宜持续,以往高增长的时代已经成为过去,亟需通过变革发掘新的增长点.对于竞争激烈的线下零售行业而言,则更需如此. 零售行业一 ...
StartDT AI Lab | 智能运筹助力企业提升决策效率、优化决策质量
在人工智能和大数据时代,越来越多的云上数据和越来越智能的模型开始辅助人们做出各种最优决策,从运营效率.成本节约.最优配置等方方面面,实现降本增效,进一步提升商业效率.京东.美团.滴滴.顺丰等众多知名厂 ...
StartDT AI Lab | 数据增强技术如何实现场景落地与业务增值？
有人说,「深度学习“等于”深度卷积神经网络算法模型+大规模数据+云端分布式算力」.也有人说,「能够在业内叱咤风云的AI都曾“身经百战”,经历过无数次的训练与试错」.以上都需要海量数据做依托,对于那些数 ...
阿里巴巴AI Lab成立两年，都做了些什么？
https://mp.weixin.qq.com/s/trkCGvpW6aCgnFwLxrGmvQ 撰稿 & 整理|Debra 编辑|Debra 导读:在 2018 云栖人工智能峰会上,阿里巴 ...
腾讯 AI Lab 计算机视觉中心人脸 & OCR团队近期成果介绍（3）
欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ 作者:周景超在上一期中介绍了我们团队部分已公开的国际领先的研究成果,近期我们有些新的成果和大家进一步分享. 1 人脸进展人脸是最重要的视觉 ...
AI时代：推荐引擎正在塑造人类
We shape our tools and afterwards our tools shape us. ------Marshall McLuhan 麦克卢汉说:"我们塑造了工具,反过来 ...

随机推荐

php日期时间戳，日期函数使用
date_default_timezone_get():获得当前php的时区 date_default_timezone_set():设置当前php的时区 date("Y-m-d H-i-s ...
python + selenium +win32gui + winspy 实现图片上传
过程:模拟点击上传按钮,打开Windows对话框,编辑栏输入文件路径(或网址)点击确定.网上随便找了一个进行测试. 点击后出现Windows上传对话框用 winspy 来检测窗口的句柄 python ...
SPOJ 423 Assignments 状态DP
这个题目搁置了这么久,终于搞完了. 给n个人分配n个课程,已经告诉了你n个人对哪几门感兴趣,问最多有多少种分配方式我刚开始都没找到这怎么还可以状态dp,哪来的状态转移,想用暴力DFS,果断TLE的妥 ...
十五、Numpy-科学计算基础库
Numpy: NumPy(Numerical Python) 是科学计算基础库,提供大量科学计算相关功能,比如数据统计,随机数生成等.其提供最核心类型为多维数组类型(ndarray) ...
idea使用eclipse风格
说明,只是代码编辑区采用eclipse风格,其他用的是idea的IntelliJ(白色风格) 1.下载文件 2.配置
Java 二维数组，排序、切换顺序，查表法二进制十进制，这班查找、排序（冒泡、选择）、遍历，获取最大小值（4）
Java 二维数组,排序.切换顺序,查表法二进制十进制,折半查找.排序(冒泡.选择).遍历,获取最大小值(4)
python thrift demo
简介Thrift最初由Facebook研发,主要用于各个服务之间的RPC通信,支持跨语言,常用的语言比如C++, Java, Python, PHP, Ruby, Erlang, Perl, Hask ...
吴裕雄--天生自然 PHP开发学习：连接 MySQL、创建表
<?php $servername = "localhost"; $username = "root"; $password = "admin& ...
nginx中rewrite flag
rewrite 正则表达式新URI [flag]; [flag] 选项用于调控重写的行为,它的取值可能是: last:重写完成后,会停止继续处理当前区块所有属于ngx_http_rewrite ...
vim,neovim 配置文件
插件管理用的是 https://github.com/junegunn/vim-plug 打开网址,会有示例,如何安装它本身,以及一些插件,照做,很容易完成里面有两个可用的配置文件,cp_vimrc ...

StartDT AI Lab | 视觉智能引擎——从Face ID说起，浅析顾客数字化

StartDT AI Lab | 视觉智能引擎——从Face ID说起，浅析顾客数字化的更多相关文章

随机推荐

热门专题