人脸检测及识别python实现系列(1)——配置、获取实时视频流
人脸检测及识别python实现系列(1)——配置、获取实时视频流
1. 前言
今天用多半天的时间把QQ空间里的几篇年前的旧文搬到了这里,算是完成了博客搬家。QQ空间里还剩下一些记录自己数学学习路线的学习日志,属于私人性质,不再搬运了。过完春节,快马加鞭地重修完高阶偏导数后,终于感觉到疲惫了,潜意识里觉得是时候做点东西了,一是练练手,二是换换脑子,用新鲜东西刺激一下自己,好把学习效率保持下去。于是,我选择了自己最感兴趣的人脸识别,期望能够通过摄像头识别出我自己来。正好,前两天济南新闻上说济南火车站可以刷脸进站了,招行也可以刷脸取现了,感情人家都已经大规模商用了,我这儿才刚开始研究,落后啊,继续落后啊。不管它了,知识为我所有、为我所用才是最重要的。别废话了,咱言归正传吧。
说到人脸识别,简单讲就是让程序能够识别出图像的哪个部分是人脸,然后在这个基础上考虑如何应用的问题。像早已冲出国门、走向世界的美图秀秀,以及上面说的刷脸进站、刷脸取现等都是基于人脸识别技术开发出的商用软件产品,而这一切技术的背后都离不开机器学习,更直白的说是离不开数学算法。
我想做的事情是用python写一个小程序,通过读取USB摄像头的视频流识别出我自己来。事情看起来很简单,但实际做起来需要好几个程序协作才能达成目标。首先感谢一个日本程序员,是他提供了实现思路及样例代码,国内有很多Blog和公众号转发了这篇文章,度娘可以搜到,其中一个Blog的链接如下:
度娘能搜到的都与上面相同,千篇一律。我刚开始看到这篇文章的时候很是激动一番,觉得肯定很容易实现了,但实际动手做起来才知道坑很多。作者虽然给了思路和代码,但忽略了很多关键细节,对ML刚入门的同学来说很难实现该文章描述的案例。幸运的是,菜鸟如我,虽然期间跳坑无数,死磕了近1周的时间,我还是爬出了所有的坑,达成了最初的设想,感谢那些为了我的好奇心英勇就义的脑细胞。
这个系列博文的目标不是要取代原博文,而是作为原博文的可操作版,把原博文缺失的细节补上,手把手教会你重现实例。所以,如果你只是想快速了解整个实例,请移步上面给出的链接去看原博文,那篇博文只需花费你几分钟的时间;如果你是个行动派,那就直接参照这个系列博文操练起来,这会花费你半天到几天的时间,请自行斟酌。
2. 准备工作
1)首先需要准备一个USB摄像头,能够支持Ubuntu之类的linux操作系统;
2)PC机上安装好Ubuntu14以上64位版本(尽量双系统不要虚拟机,不然模型训练速度会慢得像蜗牛),可以安装win7/win10,但我没有试过在64位win系统上安装tensorflow,虽然tensorflow已经支持win 64位系统;
3)请确定python3已安装,我给的代码都是在python3下调试通过的,python2只是简单试过,不保证在python2下能正常运行;
4)安装Tensorflow,如果你是独显,且支持CUDA,请安装GPU版本,否则选择CPU版本,我的机器安装的是GPU版本,OS是Ubuntu16.04麒麟,安装Tensorflow的操作说明请问度娘或谷歌,又或者参考本人的另一篇博文:
Google TensorFlow for GPU安装、配置大坑
5)安装opencv2,请安装openCV3.0以上版本(该版本支持python3和python2),参考如下两个链接:
http://www.cnblogs.com/freeweb/p/5794447.html
http://blog.csdn.net/qingyuanluofeng/article/details/51558270
操作指令以第一个链接为准,给第二个的原因是它给出了OpenCV3.0的安装方法,第一个是2.14的且是支持python2的,但第一个给出的指令已经足够用了,第二个博文指令啰嗦,当遇到如何支持python3的问题时供参考用;
6)安装keras、sklearn、PIP等,它们的安装说明网上有的是,也简单,这里就不多说了;
以上准备工作关键是前5步,后面第6步可以暂时不作操作,当执行程序时如果提示某个模块无法导入,再安装该模块也可。
3. 获取并显示USB摄像头实时视频
其实,利用OpenCV获取USB摄像头的视频流并展示出来非常简单,拢共不超过30行代码:
#-*- coding: utf-8 -*- import cv2
import sys
from PIL import Image def CatchUsbVideo(window_name, camera_idx):
cv2.namedWindow(window_name) #视频来源,可以来自一段已存好的视频,也可以直接来自USB摄像头
cap = cv2.VideoCapture(camera_idx) while cap.isOpened():
ok, frame = cap.read() #读取一帧数据
if not ok:
break #显示图像并等待10毫秒按键输入,输入‘q’退出程序
cv2.imshow(window_name, frame)
c = cv2.waitKey(10)
if c & 0xFF == ord('q'):
break #释放摄像头并销毁所有窗口
cap.release()
cv2.destroyAllWindows() if __name__ == '__main__':
if len(sys.argv) != 2:
print("Usage:%s camera_id\r\n" % (sys.argv[0]))
else:
CatchUsbVideo("截取视频流", int(sys.argv[1]))
根本不需要多解释,一看就能明白。接着我们再Shell控制台执行上述代码:
其中,唯一需要解释的就是camera_id,这个就是USB摄像头的索引号,一般是0,如果0不行可以试试1、2等,除非你的摄像头已经坏了,根本不能用。
本着小步快跑,一次一点小成就的原则,系列1到此结束,系列2将会继续——内容为如何利用OpenCV识别出视频中的人脸区域。
人脸检测及识别python实现系列(1)——配置、获取实时视频流的更多相关文章
- 人脸检测及识别python实现系列(2)——识别出人脸
人脸检测及识别python实现系列(2)——识别出人脸 http://www.cnblogs.com/neo-T/p/6430583.html
- 人脸检测及识别python实现系列(6)——终篇:从实时视频流识别出“我”
人脸检测及识别python实现系列(6)——终篇:从实时视频流识别出“我” 终于到了最后一步,激动时刻就要来临了,先平复一下心情,把剩下的代码加上,首先是为Model类增加一个预测函数: #识别人脸 ...
- 人脸检测及识别python实现系列(5)——利用keras库训练人脸识别模型
人脸检测及识别python实现系列(5)——利用keras库训练人脸识别模型 经过前面稍显罗嗦的准备工作,现在,我们终于可以尝试训练我们自己的卷积神经网络模型了.CNN擅长图像处理,keras库的te ...
- 人脸检测及识别python实现系列(4)——卷积神经网络(CNN)入门
人脸检测及识别python实现系列(4)——卷积神经网络(CNN)入门 上篇博文我们准备好了2000张训练数据,接下来的几节我们将详细讲述如何利用这些数据训练我们的识别模型.前面说过,原博文给出的训练 ...
- 人脸检测及识别python实现系列(3)——为模型训练准备人脸数据
人脸检测及识别python实现系列(3)——为模型训练准备人脸数据 机器学习最本质的地方就是基于海量数据统计的学习,说白了,机器学习其实就是在模拟人类儿童的学习行为.举一个简单的例子,成年人并没有主动 ...
- 基于OpenCv的人脸检测、识别系统学习制作笔记之三
1.在windows下编写人脸检测.识别系统.目前已完成:可利用摄像头提取图像,并将人脸检测出来,未进行识别. 2.在linux下进行编译在windows环境下已经能运行的代码. 为此进行了linux ...
- OpenCV 学习笔记 05 人脸检测和识别
本节将介绍 Haar 级联分类器,通过对比分析相邻图像区域来判断给定图像或子图像与已知对象是否匹配. 本章将考虑如何将多个 Haar 级联分类器构成一个层次结构,即一个分类器能识别整体区域(如人脸) ...
- 人工智能之基于face_recognition的人脸检测与识别
不久乘高铁出行,看见高铁火车站已经实现了"刷脸进站",而且效率很高,很感兴趣,今天抽时间研究一下,其实没那么复杂. 我基本上是基于https://github.com/ageitg ...
- 基于Opencv的人脸检测及识别
一.实验目的:我这里完成的是,将8张人脸图片(4组,每组两张)存入库中,选取1张图片,程序识别出与其匹配的另一张. 这里介绍分三个步骤完成该工作,①程序读取摄像头.拍照 ②程序从电脑文档中读取图片 ...
随机推荐
- Selenium自动化测试之结果处理
Selenium自动化测试之结果处理 一.断言 断言相当于性能测试中的检查点,常用断言种类很多,具体可以查看断言API:判断预期结果和实际结果是否一致,断言成功,程序继续处理,失败则终止运行,示例如下 ...
- openstack 虚拟机 迁移
迁移. 如果 你的 云 系统 正在 使用 共享 存储, 使用 nova live- migration 命令 就可以. 首先, 要 获得 需要 被 迁移 的 实例 列表: # nova list -- ...
- Unity设置相机正交相机和透视相机的动态切换
Camera.main.orthographic = true; Camera.main.orthographicSize = 4; Camera.main.orthographic = ...
- ORA-27300: OS system dependent operation:sendmsg failed with status: 105 ORA-27301: OS failure message: No buffer space available
早上查看数据库alert日志,发现如下ORA-报错: kgxpvfynet: mtype: 61 process 6460 failed because of a resource problem i ...
- (Les16 执行数据库恢复)-表空间恢复
NOARCHIVELOG模式下丢失了数据文件 数据库处于NOARCHIVELOG模式时,如果丢失任何数据文件,执行以下步骤 1.如果实例尚未关闭,请关闭实例 2 ...
- 一个百度MAP导航的基础封装
项目中需要根据点击时候点击的内容,输入百度地图查找并展示规划等相关功能 于是封装了一个单独的百度map的html页面以供调用 功能包括了 ①展示底图 ②切换卫星图,切换卫星路线图,切换普通地图 ③通过 ...
- eclipse手动安装alibaba代码规范插件+取消阿里编码规约插件扫描出来的警告及错误
如果你的开发环境无法访问外网,那么手动安装阿里巴巴的代码规范插件是一个不错的选择.另外,很多教程说该插件需要jdk1.8以上,我试了一下jdk1.7也是可以运行的,更低的版本就不知道了,貌似jdk1. ...
- debian系统,启动Wireshark,出现Couldn't run /usr/bin/dumpcap in child process:权限不够
这是由于当前用户没有权限运行/usr/bin/dumpcap造成的./usr/bin/dumpcap是Wireshark的包捕获引擎. 先用ls命令看一下dumpcap的权限情况:xy@debian- ...
- exynos4412—CMU裸板复习
本章描述了Exynos 4412 SCP的时钟管理单元(CMUs).在Exynos 4412 SCP中,CMUs控制相位锁相环(PLLs),并为CPU.总线和单个ip的功能时钟生成系统时钟.它们还与电 ...
- linux查看文件命令tail的使用
一.介绍 linux tail命令用途是依照要求将指定的文件的最后部分输出到终端中,通俗讲来,就是把某个档案文件的最后几行显示到终端上,假设该档案有更新,tail会自己主动刷新,确保你看到最新的档案内 ...