OpenCV+python 人脸识别
首先给大家推荐一本书:机器学习算法原理与编程实践
本文内容全部转载于书中,相当于一个读书笔记了吧
绪论
1992年麻省理工学院通过实验对比了基于结构特征的方法与基于模版匹配的方法,发现模版匹配的方法要优于基于特征的方法。
以支持向量机为代表的统计学习理论在随后被应用到了人脸识别与确认中去。但是由于算法运行效率问题,很快被一种新的算法替代了。这就是2001年康柏研究院提出的基于简单矩形特征和AdaBoost的实时人脸检测系统。该方法的主要贡献包括:
1.可以快速计算简单矩形特征作为人脸图像特征
2.基于AdaBoost将大量弱分类器进行组合形成强分类器的学习方法。
3.采用了级联(Cascade)技术提高检测速度。目前,基于这种人脸/非人脸学习的策略已经能够实现准实时的多姿态人脸检测与跟踪,这为后端的人脸识别提供了良好的基础。
人脸检测
人脸检测主要用于人脸识别的预处理,即在图像中标注出人脸所处的位置和大小。为了能够确定图片中包含一张或几张人脸,首先要确定人脸的通用结构。我们都有:眼镜、鼻子,前额,颧骨和嘴,所有这些构成了一张通用的人脸结构。下图的特征组件分别标识了上述结构。
组合这些特征就可以得到一张近似的人脸:
人脸检测的主流方法是AdaBoost,它是一种用来分类的方法,通过把一些比较弱的分类方法合在一起,可以组合出新的更强的分类器。AdaBoost有一个迭代的过程,为了快速处理,在每次迭代中,我们仅仅快速地排除图片中不属于人脸的区域,保留那些我们还不确定的区域。在每次迭代中,我们都提高了对图片中人脸定位的概率,直到做出最终的决定。换句话说,不同于确定图片中人脸的位置,我们选择的排除图片中不包含人脸位置,因为排除算法的运算速度更快。我们称这个过程为级联过程。
OpenCV中常用的特征分类器有两类:Haar特征和LBP特征
在OpenCV中使用Haar特征检测人脸,那么需要使用OpenCV提供的xml文件(级联表)在sources\data目录下。这张级联表有一个训练好的AdaBoost训练集。首先要采用样本的Haar特征训练分类器,从而得到一个级联的AdaBoost分类器。训练的方式包含两个方面:
1.正例样本,即待检测的目标样本
2.反例样本,即其他任意的图片
然后将这些图片统一缩放为相同的尺寸,这个过程就是归一化。最后统计出分类结果。
实现效果:
代码:
# -*- coding: utf-8 -*-
"""
Created on Wed Jun 22 20:59:21 2016
@author: Administrator
"""
# -*- coding: utf-8 -*
import numpy as np
import cv2
#要使用Haar cascade实现,仅需要把库修改为lbpcascade_frontalface.xml
face_cascade = cv2.CascadeClassifier('lbpcascade_frontalface.xml')
img = cv2.imread('woman.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 识别输入图片中的人脸对象.返回对象的矩形尺寸
# 函数原型detectMultiScale(gray, 1.2,3,CV_HAAR_SCALE_IMAGE,Size(30, 30))
# gray需要识别的图片
# 1.03:表示每次图像尺寸减小的比例
# 5:表示每一个目标至少要被检测到4次才算是真的目标(因为周围的像素和不同的窗口大小都可以检测到人脸)
# CV_HAAR_SCALE_IMAGE表示不是缩放分类器来检测,而是缩放图像,Size(30, 30)为目标的最小最大尺寸
# faces:表示检测到的人脸目标序列
faces = face_cascade.detectMultiScale(gray, 1.03, 5)
for (x,y,w,h) in faces:
if w+h>200:#//针对这个图片画出最大的外框
img2 = cv2.rectangle(img,(x,y),(x+w,y+h),(255,255,255),4)
roi_gray = gray[y:y+h, x:x+w]
roi_color = img[y:y+h, x:x+w]
cv2.imshow('img',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
cv2.imwrite("head.jpg", img) # 保存图片
AdaBoost算法概述
Haar级联检测和LBP检测都是使用AdaBoost算法实现的。AdaBoost算法是Adaptive Boosting算法的缩写,是Boosting算法的改进版本。AdaBoost与其前身Boost算法都是从决策树发展出来的一种算法,其算法思想是针对同一个训练集样本的不同特征,分别训练出不同的弱分类器,然后把这些弱分类器级联起来,构成一个最终分类器,即强分类器。
从结构上讲,AdaBoost与其他的机器学习算法不同,该算法可以分为两层,第一层是AdaBoost主算法,第二层是其他的二分类算法,所以该算法是一种复合型算法。第二层最常用的是单层决策树。当然也可以是其他任何二分类算法。例如梯度下降算法、SVM等。
人脸识别
目前最常用的自动人脸识别技术仍旧是特征脸提取方法。特征脸方法是从整体上对人脸识别的方法:一种面部图像可以表示为从高维图像空间映射到地位空间的一个点。这样可以使得分类边的更加容易。
降维
一幅图像只能表示为一个对象,对于w x h的灰度图像,只能表示为w*h维的向量,那么100*100像素大小的图像就需要10000维的向量空间。对于一副人脸图像,显然在维数空间中只有少量像素对我们有用。所以可以降维,矩阵可以近似的表示为一个特征值和特征向量的乘积,如果我们能够提取出高维向量中某些特有的特征或者相关变量,就能用一个低维空间的向量近似地表示这个高维向量。对于这个高维向量,只有高喊最多信息的那些维上的数据才有意义,不重要的维可以在计算中忽略,并且降维之后的低维向量不会损失掉特征间的差异性。这就是主成份分析的思想(PCA),1901年就由皮尔逊发布了基本原理:
PCA人脸识别算法
PCA人脸识别算法的实现步骤如下:
1.首先把所有的训练图片集的每张图片都转换为行向量的形式
2.计算向量集的PCA子空间,并得到特征值和特征向量及均值
3.将训练集的图片与对应的标签都投影到这个PCA子空间,行程一个投影矩阵
4.导入待识别的图像,并进行向量化,也投影到这个PCA子空间
5.计算PCA投影后的训练集向量与待识别图片投影后向量的距离,并找出最接近的那个
# -*- coding: utf-8 -*-
from numpy import *
import numpy as np
import sys,os
import copy
import cv2
import PIL.Image as Image
import matplotlib.pyplot as plt
class Eigenfaces(object):
def __init__(self):
self.eps = 1.0e-16
self.X = []
self.y = []
self.Mat=[]
self.eig_v = 0
self.eig_vect = 0
self.mu = 0
self.projections = []
self.dist_metric=0
def loadimgs(self,path): # 加载图片数据集
classlabel = 0
for dirname, dirnames, filenames in os.walk(path):
for subdirname in dirnames:
sub_path = os.path.join(dirname, subdirname)
for filename in os.listdir(sub_path):
im = Image.open(os.path.join(sub_path, filename))
im = im.convert("L") #数据转换为long类型
self.X.append(np.asarray(im, dtype=np.uint8))
self.y.append(classlabel)
classlabel += 1
# 将图片变为行向量 # 生成图片矩阵
def genRowMatrix(self):
self.Mat = np.empty((0, self.X[0].size), dtype=self.X[0].dtype)
for row in self.X:
self.Mat = np.vstack((self.Mat, np.asarray(row).reshape(1,-1)))
# 计算特征脸
def PCA(self, pc_num =0):
self.genRowMatrix()
[n,d] = shape(self.Mat)
if ( pc_num <= 0) or ( pc_num>n): pc_num = n
self.mu = self.Mat.mean(axis =0)
self.Mat -= self.mu
if n>d:
XTX = np.dot (self.Mat.T,self.Mat)
[ self.eig_v , self.eig_vect ] = linalg.eigh (XTX)
else :
XTX = np.dot(self.Mat,self.Mat.T)
[ self.eig_v , self.eig_vect ] = linalg.eigh (XTX)
self.eig_vect = np.dot(self.Mat.T, self.eig_vect)
for i in xrange(n):
self.eig_vect[:,i] = self.eig_vect[:,i]/linalg.norm(self.eig_vect[:,i])
idx = np.argsort(-self.eig_v)
self.eig_v = self.eig_v[idx]
self.eig_vect = self.eig_vect[:,idx ]
self.eig_v = self.eig_v[0:pc_num ].copy () # select only pc_num
self.eig_vect = self.eig_vect[:,0:pc_num].copy ()
def compute(self):
self.PCA()
for xi in self.X:
self.projections.append(self.project(xi.reshape(1,-1)))
def distEclud(self, vecA, vecB): # 欧氏距离
return linalg.norm(vecA-vecB)+self.eps
def cosSim(self, vecA, vecB): # 夹角余弦
return (dot(vecA,vecB.T)/((linalg.norm(vecA)*linalg.norm(vecB))+self.eps))[0,0]
# 映射
def project(self,XI):
if self.mu is None: return np.dot(XI,self.eig_vect)
return np.dot(XI-self.mu, self.eig_vect)
#预测最接近的特征脸
def predict(self,XI):
minDist = np.finfo('float').max
minClass = -1
Q = self.project(XI.reshape(1,-1))
for i in xrange(len(self.projections)):
dist = self.dist_metric(self.projections[i], Q)
if dist < minDist:
minDist = dist
minClass = self.y[i]
return minClass
# 生成特征脸
def subplot(self,title, images):
fig = plt.figure()
fig.text(.5, .95, title, horizontalalignment='center')
for i in xrange(len(images)):
ax0 = fig.add_subplot(4,4,(i+1))
plt.imshow(asarray(images[i]), cmap="gray")
plt.xticks([]), plt. yticks([]) # 隐藏 X Y 坐标
plt.show()
# 归一化
def normalize(self, X, low, high, dtype=None):
X = np.asarray(X)
minX, maxX = np.min(X), np.max(X)
X = X - float(minX)
X = X / float((maxX - minX))
X = X * (high-low)
X = X + low
if dtype is None:
return np.asarray(X)
return np.asarray(X, dtype=dtype)
'''
# 重构
def reconstruct(self,W, Y, mu=None):
if mu is None: return np.dot(Y,W.T)
return np.dot(Y, W.T) + mu
# 从外部数据计算投影
def out_project(self,W,XI,mu):
if mu is None: return np.dot(XI,W)
return np.dot(XI-mu, W)
'''
生成特征脸:
代码:
# -*- coding: utf-8 -*-
from numpy import *
import sys,os
from pca import *
reload(sys)
sys.setdefaultencoding('utf-8')
ef = Eigenfaces()
ef.dist_metric=ef.distEclud
ef.loadimgs("orl_faces/")
ef.compute()
E = []
X = mat(zeros((10,10304)))
for i in xrange(16):
X = ef.Mat[i*10:(i+1)*10,:].copy()
# X = ef.normalize(X.mean(axis =0),0,255)
X = X.mean(axis =0)
imgs = X.reshape(112,92)
E.append(imgs)
ef.subplot(title="AT&T Eigen Facedatabase", images=E)
执行人脸识别:
from numpy import *
import sys,os
from pca import *
reload(sys)
sys.setdefaultencoding('utf-8')
ef = Eigenfaces()
ef.dist_metric=ef.distEclud
ef.loadimgs("orl_faces/")
ef.compute()
# 创建测试集
testImg = ef.X[30]
print "实际值 =", ef.y[30], "->", "预测值 =",ef.predict(testImg)
待续。。。
代码下载:
http://download.csdn.net/detail/wangyaninglm/9555895
参考文献
机器学习算法原理与编程实践
OpenCV+python 人脸识别的更多相关文章
- OpenCV + Python 人脸检测
必备知识 Haar-like opencv api 读取图片 灰度转换 画图 显示图像 获取人脸识别训练数据 探测人脸 处理人脸探测的结果 实例 图片素材 人脸检测代码 人脸检测结果 总结 下午的时候 ...
- 使用OpenCV进行人脸识别
不断维护的地址:http://plzcoding.com/face-recognition-with-opencv/ 怎样使用OpenCV进行人脸识别 本文大部分来自OpenCV官网上的Face Re ...
- 基于 OpenCV 的人脸识别
基于 OpenCV 的人脸识别 一点背景知识 OpenCV 是一个开源的计算机视觉和机器学习库.它包含成千上万优化过的算法,为各种计算机视觉应用提供了一个通用工具包.根据这个项目的关于页面,OpenC ...
- PyQt5+Caffe+Opencv搭建人脸识别登录界面
PyQt5+Caffe+Opencv搭建人脸识别登录界面(转载) 最近开始学习Qt,结合之前学习过的caffe一起搭建了一个人脸识别登录系统的程序,新手可能有理解不到位的情况,还请大家多多指教. 我的 ...
- 转:基于开源项目OpenCV的人脸识别Demo版整理(不仅可以识别人脸,还可以识别眼睛鼻子嘴等)【模式识别中的翘楚】
文章来自于:http://blog.renren.com/share/246648717/8171467499 基于开源项目OpenCV的人脸识别Demo版整理(不仅可以识别人脸,还可以识别眼睛鼻子嘴 ...
- opencv+opencv_contrib 人脸识别和检测 python开发环境快速搭建(30分钟)图文教程
很多朋友为了学习python.ML(机器学习).DL(深度学习).opencv等花费了大量时间配置安装环境(一个朋友花了4天时间才配置好)各种搜索.下载.安装配置,出问题等. 市面上的配置资料很多,选 ...
- 【python人脸识别】使用opencv识别图片中的人脸
概述: OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库 为什么有OpenCV? 计算机视觉市场巨大而且持续增长,且这方面没有标准API,如今的计算机视觉软件大概有以下三种: 1.研究 ...
- python之OpenCv(四)---人脸识别
对特定图像进行识别,最关键的是要有识别对象的特征文件.OpenCV已经内置了人脸识别特征文件,我们只要使用OpenCV的CascadeClassifier类即可进行识别. 语法: https://gi ...
- python中使用Opencv进行人脸识别
上一节讲到人脸检测,现在讲一下人脸识别.具体是通过程序采集图像并进行训练,并且基于这些训练的图像对人脸进行动态识别. 人脸识别前所需要的人脸库可以通过两种方式获得:1.自己从视频获取图像 2.从人 ...
随机推荐
- dnslog搭建
为什么想重写这个呢,想说后面扫描ssrf和命令执行的时候,能快速改成自己想要的api,更容易修改一些. 工具改自:https://github.com/bugScanTeam/DNSLog 需要两个域 ...
- codevs 搜索题汇总(钻石+大师级)
1043 方格取数 2000年NOIP全国联赛提高组 时间限制: 1 s 空间限制: 128000 KB 题目等级 : 钻石 Diamond 题目描述 Description 设有N*N的方格图 ...
- [HNOI2003]激光炸弹
Description 一种新型的激光炸弹,可以摧毁一个边长为R的正方形内的所有的目标.现在地图上有n个目标,用整数,表示目标在地图上的位置,每个目标都有一个价值.激光炸弹的投放是通过卫星定位的,但其 ...
- 计蒜客NOIP模拟赛(3)D1T3 任性的国王
X 国的地图可以被看作一个两行 nn 列的网格状图.现在 X 国需要修建铁路,然而该国的国王非常小气,他只想保证位于某两列之间的所有城市互相可以到达就行了,在此基础上,他希望所花费的代价最小. 铁路可 ...
- [UOJ]#36. 【清华集训2014】玛里苟斯
题目大意:给n个数字,求子集的异或和的k次方的期望(n<=10^5,k<=5,保证答案小于2^63) 做法:首先如果从集合中拿出a和b,把a和a xor b放回集合,子集的异或和与原来是一 ...
- UVA1658:Admiral
题意:给定一个有向带权图,求两条不相交(无公共点)的路径且路径权值之和最小,路径由1到v 题解:这题的关键就在于每个点只能走一遍,于是我们想到以边换点的思想,用边来代替点,怎么代替呢? 把i拆成i和i ...
- 例10-3 uva10375(唯一分解定理)
题意:已知C(m,n) = m!/(n!(m-n)!),已知p,q,r,s,求C(p,q)/C(r,s) 思路: 全部分解成质因子,相乘则加,除则减 #include <iostream> ...
- Cloud TPU Demos(TensorFlow 云 TPU 样例代码)
Cloud TPU Demos 这是一个Python脚本的集合,适合在开源TensorFlow和 Cloud TPU 上运行. 如果您想对模型做出任何修改或改进,请提交一个 PR ! https:// ...
- Docker 基础 : 镜像
目录 获取镜像 查看镜像信息 搜索镜像 删除镜像 创建镜像 导出和导入镜像 上传镜像 总结 镜像是 Docker 的三大核心概念之一.Docker 运行容器前需要本地存在对应的镜像,如果本地没有对应的 ...
- Maven的pom.xml文件结构之基本配置packaging和多模块聚合结构(微服务)
1. packaging packaging给出了项目的打包类型,即作为项目的发布形式,其可能的类型.在Maven 3中,其可用的打包类型如下: jar,默认类型 war ejb ear rar pa ...