人脸检测及识别python实现系列(1)——配置、获取实时视频流
人脸检测及识别python实现系列(1)——配置、获取实时视频流
1. 前言
今天用多半天的时间把QQ空间里的几篇年前的旧文搬到了这里,算是完成了博客搬家。QQ空间里还剩下一些记录自己数学学习路线的学习日志,属于私人性质,不再搬运了。过完春节,快马加鞭地重修完高阶偏导数后,终于感觉到疲惫了,潜意识里觉得是时候做点东西了,一是练练手,二是换换脑子,用新鲜东西刺激一下自己,好把学习效率保持下去。于是,我选择了自己最感兴趣的人脸识别,期望能够通过摄像头识别出我自己来。正好,前两天济南新闻上说济南火车站可以刷脸进站了,招行也可以刷脸取现了,感情人家都已经大规模商用了,我这儿才刚开始研究,落后啊,继续落后啊。不管它了,知识为我所有、为我所用才是最重要的。别废话了,咱言归正传吧。
说到人脸识别,简单讲就是让程序能够识别出图像的哪个部分是人脸,然后在这个基础上考虑如何应用的问题。像早已冲出国门、走向世界的美图秀秀,以及上面说的刷脸进站、刷脸取现等都是基于人脸识别技术开发出的商用软件产品,而这一切技术的背后都离不开机器学习,更直白的说是离不开数学算法。
我想做的事情是用python写一个小程序,通过读取USB摄像头的视频流识别出我自己来。事情看起来很简单,但实际做起来需要好几个程序协作才能达成目标。首先感谢一个日本程序员,是他提供了实现思路及样例代码,国内有很多Blog和公众号转发了这篇文章,度娘可以搜到,其中一个Blog的链接如下:
度娘能搜到的都与上面相同,千篇一律。我刚开始看到这篇文章的时候很是激动一番,觉得肯定很容易实现了,但实际动手做起来才知道坑很多。作者虽然给了思路和代码,但忽略了很多关键细节,对ML刚入门的同学来说很难实现该文章描述的案例。幸运的是,菜鸟如我,虽然期间跳坑无数,死磕了近1周的时间,我还是爬出了所有的坑,达成了最初的设想,感谢那些为了我的好奇心英勇就义的脑细胞。
这个系列博文的目标不是要取代原博文,而是作为原博文的可操作版,把原博文缺失的细节补上,手把手教会你重现实例。所以,如果你只是想快速了解整个实例,请移步上面给出的链接去看原博文,那篇博文只需花费你几分钟的时间;如果你是个行动派,那就直接参照这个系列博文操练起来,这会花费你半天到几天的时间,请自行斟酌。
2. 准备工作
1)首先需要准备一个USB摄像头,能够支持Ubuntu之类的linux操作系统;
2)PC机上安装好Ubuntu14以上64位版本(尽量双系统不要虚拟机,不然模型训练速度会慢得像蜗牛),可以安装win7/win10,但我没有试过在64位win系统上安装tensorflow,虽然tensorflow已经支持win 64位系统;
3)请确定python3已安装,我给的代码都是在python3下调试通过的,python2只是简单试过,不保证在python2下能正常运行;
4)安装Tensorflow,如果你是独显,且支持CUDA,请安装GPU版本,否则选择CPU版本,我的机器安装的是GPU版本,OS是Ubuntu16.04麒麟,安装Tensorflow的操作说明请问度娘或谷歌,又或者参考本人的另一篇博文:
Google TensorFlow for GPU安装、配置大坑
5)安装opencv2,请安装openCV3.0以上版本(该版本支持python3和python2),参考如下两个链接:
http://www.cnblogs.com/freeweb/p/5794447.html
http://blog.csdn.net/qingyuanluofeng/article/details/51558270
操作指令以第一个链接为准,给第二个的原因是它给出了OpenCV3.0的安装方法,第一个是2.14的且是支持python2的,但第一个给出的指令已经足够用了,第二个博文指令啰嗦,当遇到如何支持python3的问题时供参考用;
6)安装keras、sklearn、PIP等,它们的安装说明网上有的是,也简单,这里就不多说了;
以上准备工作关键是前5步,后面第6步可以暂时不作操作,当执行程序时如果提示某个模块无法导入,再安装该模块也可。
3. 获取并显示USB摄像头实时视频
其实,利用OpenCV获取USB摄像头的视频流并展示出来非常简单,拢共不超过30行代码:
#-*- coding: utf-8 -*- import cv2
import sys
from PIL import Image def CatchUsbVideo(window_name, camera_idx):
cv2.namedWindow(window_name) #视频来源,可以来自一段已存好的视频,也可以直接来自USB摄像头
cap = cv2.VideoCapture(camera_idx) while cap.isOpened():
ok, frame = cap.read() #读取一帧数据
if not ok:
break #显示图像并等待10毫秒按键输入,输入‘q’退出程序
cv2.imshow(window_name, frame)
c = cv2.waitKey(10)
if c & 0xFF == ord('q'):
break #释放摄像头并销毁所有窗口
cap.release()
cv2.destroyAllWindows() if __name__ == '__main__':
if len(sys.argv) != 2:
print("Usage:%s camera_id\r\n" % (sys.argv[0]))
else:
CatchUsbVideo("截取视频流", int(sys.argv[1]))
根本不需要多解释,一看就能明白。接着我们再Shell控制台执行上述代码:

其中,唯一需要解释的就是camera_id,这个就是USB摄像头的索引号,一般是0,如果0不行可以试试1、2等,除非你的摄像头已经坏了,根本不能用。
本着小步快跑,一次一点小成就的原则,系列1到此结束,系列2将会继续——内容为如何利用OpenCV识别出视频中的人脸区域。
人脸检测及识别python实现系列(1)——配置、获取实时视频流的更多相关文章
- 人脸检测及识别python实现系列(2)——识别出人脸
人脸检测及识别python实现系列(2)——识别出人脸 http://www.cnblogs.com/neo-T/p/6430583.html
- 人脸检测及识别python实现系列(6)——终篇:从实时视频流识别出“我”
人脸检测及识别python实现系列(6)——终篇:从实时视频流识别出“我” 终于到了最后一步,激动时刻就要来临了,先平复一下心情,把剩下的代码加上,首先是为Model类增加一个预测函数: #识别人脸 ...
- 人脸检测及识别python实现系列(5)——利用keras库训练人脸识别模型
人脸检测及识别python实现系列(5)——利用keras库训练人脸识别模型 经过前面稍显罗嗦的准备工作,现在,我们终于可以尝试训练我们自己的卷积神经网络模型了.CNN擅长图像处理,keras库的te ...
- 人脸检测及识别python实现系列(4)——卷积神经网络(CNN)入门
人脸检测及识别python实现系列(4)——卷积神经网络(CNN)入门 上篇博文我们准备好了2000张训练数据,接下来的几节我们将详细讲述如何利用这些数据训练我们的识别模型.前面说过,原博文给出的训练 ...
- 人脸检测及识别python实现系列(3)——为模型训练准备人脸数据
人脸检测及识别python实现系列(3)——为模型训练准备人脸数据 机器学习最本质的地方就是基于海量数据统计的学习,说白了,机器学习其实就是在模拟人类儿童的学习行为.举一个简单的例子,成年人并没有主动 ...
- 基于OpenCv的人脸检测、识别系统学习制作笔记之三
1.在windows下编写人脸检测.识别系统.目前已完成:可利用摄像头提取图像,并将人脸检测出来,未进行识别. 2.在linux下进行编译在windows环境下已经能运行的代码. 为此进行了linux ...
- OpenCV 学习笔记 05 人脸检测和识别
本节将介绍 Haar 级联分类器,通过对比分析相邻图像区域来判断给定图像或子图像与已知对象是否匹配. 本章将考虑如何将多个 Haar 级联分类器构成一个层次结构,即一个分类器能识别整体区域(如人脸) ...
- 人工智能之基于face_recognition的人脸检测与识别
不久乘高铁出行,看见高铁火车站已经实现了"刷脸进站",而且效率很高,很感兴趣,今天抽时间研究一下,其实没那么复杂. 我基本上是基于https://github.com/ageitg ...
- 基于Opencv的人脸检测及识别
一.实验目的:我这里完成的是,将8张人脸图片(4组,每组两张)存入库中,选取1张图片,程序识别出与其匹配的另一张. 这里介绍分三个步骤完成该工作,①程序读取摄像头.拍照 ②程序从电脑文档中读取图片 ...
随机推荐
- [SCOI2005]互不侵犯(状压DP)
嗝~算是状压DP的经典题了~ #\(\mathcal{\color{red}{Description}}\) 在\(N×N\)的棋盘里面放\(K\)个国王,使他们互不攻击,共有多少种摆放方案.国王能攻 ...
- UVA - 1197 (简单并查集计数)
Severe acute respiratory syndrome (SARS), an atypical pneumonia of unknown aetiology, was recognized ...
- ora.ctssd OBSERVER
[grid@ydb1 ~]$ crsctl status res -t -init ora.ctssd 1 ONLINE ONLINE ydb1 ...
- Docker 常用命令——容器
1.新建并启动容器 docker run [option] images [command][arg] #根据镜像新建容器并运行.如果本地没有镜像则从docker hub上拉取. --name ...
- App跳转系统设置界面
NSString * urlString = @"App-Prefs:root=WIFI"; if ([[UIApplication sharedApplication] canO ...
- Java---Huffman树的实现
什么是哈弗曼树 1.哈弗曼树是最优二叉树,树的带权路径长度最小的一个二叉树. 2.带权路径长度为根节点到该节点的路径长度和该节点权重的乘积.3.路径长度为当前节点到另一个节点所经过的分支的个数(边的个 ...
- Nginx与Tomcat实现请求动态数据与请求静态资源的分离
上篇博客说明了Nginx在应用架构中的作用,以及负载均衡的思路.这篇实践一下其中的访问静态资源与访问动态资源的操作. 一.认识访问静态资源与访问动态资源的区别 静态资源:指存储在硬盘内的数据,固定的数 ...
- tp3.2和Bootstrap模态框导入excel表格数据
导入按钮 <button class="btn btn-info" type="button" id="import" data-to ...
- Zeta Linux上进行WiFi Direct调试
1)叫醒p2p网卡 ifconfig p2p0 up 2)启动wpa_supplicant服务 wpa_supplicant -Dnl80211 -ip2p0 -c /etc/wpa_suppli ...
- 基于STM32F103ZET6 HC_SR501人体红外感应
这是最后的实验现象,有人走过会一直输出有人,离开范围时则输出没人 开发板 PZ6086L ,HC_SR501模块 这是HC_SR501的示意图,,VCC和GND不再多做介绍,5V供电就行, OUT接口 ...