深度学习项目——基于卷积神经网络(CNN)的人脸在线识别系统
基于卷积神经网络(CNN)的人脸在线识别系统
本设计研究人脸识别技术,基于卷积神经网络构建了一套人脸在线检测识别系统,系统将由以下几个部分构成:
制作人脸数据集、CNN神经网络模型训练、人脸检测、人脸识别。经过实验,确定该系统可对本人的人脸进行快速并准确的检测与识别。
关键词: 神经网络; 图像处理; 人脸检测;人脸识别;TensorFlow;模型训练
一、设计目标
1.掌握人脸识别原理;
2.掌握卷积神经网络算法原理
3.掌握卷积神经网络模型训练过程;
4.掌握常用图像处理技术;
设计内容与要求
1.完成基于卷积神经网络的人脸在线识别系统算法设计;
2.完成基于卷积神经网络的人脸在线识别系统模型训练;
3.检测并且识别出人脸;
二、制作人脸数据集
2.1、制作我的人脸数据集
人脸检测出人脸位置,返回坐标、尺寸把脸用数组切片的方法截取下来,把截取的小图片保存下来作为数据集。
本系统获取本人的人脸数据集10000张,使用的是dlib来识别人脸,虽然速度比OpenCV识别慢,但是识别效果更好。
其中,人脸大小:64*64。
2.2、主要步骤
(1)加载 dlib机器学习的开源库
(2)图像预处理 cvtColor(灰度化)。
(3)使用dlib自带的frontal_face_detector进行特征提取。
(4)使用特征提取器进行人脸检测。
(5)人脸保存。
2.3、制作结果
2.5 、制作其他人脸数据集
本系统使用人脸数据集下载:http://vis-www.cs.umass.edu/lfw/lfw.tgz。
先将下载的图片集放在img_source目录下,用dlib来批量识别图片中的人脸部分,
并保存到指定目录faces_other。人脸大小为64*64。
2.6、主要步骤
(1)读入人脸数据集源文件
(2)加载 dlib机器学习的开源库。
(3)用dlib来批量识别图片中的人脸部分。
(4)人脸保存。
2.7、制作结果
三、 神经网络模型训练
3.1、卷积神经网络内部分析
第一、二层(卷积层1、池化层1),输入图片64*64*3,输出图片32*32*32;
第三、四层(卷积层2、池化层2),输入图片32*32*32,输出图片16*16*64;
第五、六层(卷积层3、池化层3),输入图片16*16*64,输出图片8*8*64;
第七层(全连接层),输入图片8*8*64,reshape到1*4096,输出1*512;
第八层(输出层),输入1*512,输出1*2。
输出神经网络输出的1*2,与标签y_ [0,1]、[1,0]对比得出损失,损失函数为交叉熵,优化器采用Adan优化器,计算模型准确率。
代码实现:
cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=out, labels=y_))
optimizer = tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)
accuracy = tf.reduce_mean(tf.cast(tf.equal(tf.argmax(out, 1), tf.argmax(y_, 1)), tf.float32))
3.2、输入层
人脸检测出人脸位置,返回坐标、尺寸把脸用数组切片的方法截取下来,把截取的小图片送入神经网络进行训练,输入的图片64*64*3。
3.3、卷积层
本网路共三层卷积层,卷积核大小为(3,3),卷积步长为[1,1,1,1],即一步,padding=“SAME”。卷积层提取特征,
增加通道数,图片大小不变。
3.4、池化层
本文提出的池化层采用最大值采样,采样大小为2*2,即把输入的特征图分割成不重叠的2*2大小的矩形,对每个矩形取最大值,
所以输出特征图的长和宽均是输入特征图的一半。
3.5、全连接层
为了增强网络的非线性能力,同时限制网络规模的大小,网络在特征提取层提取特征后,接入一个全连接层,该层的每一个神经元
与前一层的所有神经元互相连接,将图片的卷积输出压扁成一个一维向量,输出1*512。
3.6、输出层
本系统共分两类,一类我的人脸(yes),另一类其他人脸(no),从全连接层输入1*512,输出层输出1*2。为求loss做准备。
3.7、主要步骤
(1)读入制作好的人脸数据集,将图片数据与标签转化成数组。
(2)划分测试集:训练集=20:1,做归一化处理。
(3)传入卷积神经网络。
(4)训练。
3.8、训练结果
四、利用模型进行人脸识别
4.1 、主要步骤
(1)打开摄像头获取图片进行灰度化。
(2)人脸检测。
(3)导入训练好的神经网络模型。
(4)人脸识别。
4.2、识别结果
五、总结
本次设计主要研究了基于卷积神经网络的人脸在线识别系统。设计了基于机器视觉的人脸图像采集系统,
自己制作了训练需要的人脸数据集。设计并实现了基于卷积神经网络的人脸识别系统,完成了基于卷积神经网络的
人脸在线识别系统算法设计、神经网络模型训练,实现了对人脸的在线检测与识别。检测出本人人脸,则在人脸上
显示”yes, my face”,若不是我的人脸,则在人脸上显示”no, other face ”。
六 、代码
见个人GitHub:https://github.com/hhhvvvddd/CNN_faces_recognition
浅谈则止,深入理解AI大道理
扫描下方“AI大道理”,选择“关注”公众号
欢迎加入!
深度学习项目——基于卷积神经网络(CNN)的人脸在线识别系统的更多相关文章
- 【深度学习系列】卷积神经网络CNN原理详解(一)——基本原理
上篇文章我们给出了用paddlepaddle来做手写数字识别的示例,并对网络结构进行到了调整,提高了识别的精度.有的同学表示不是很理解原理,为什么传统的机器学习算法,简单的神经网络(如多层感知机)都可 ...
- 深度学习项目——基于循环神经网络(RNN)的智能聊天机器人系统
基于循环神经网络(RNN)的智能聊天机器人系统 本设计研究智能聊天机器人技术,基于循环神经网络构建了一套智能聊天机器人系统,系统将由以下几个部分构成:制作问答聊天数据集.RNN神经网络搭建.seq2s ...
- 基于卷积神经网络CNN的电影推荐系统
本项目使用文本卷积神经网络,并使用MovieLens数据集完成电影推荐的任务. 推荐系统在日常的网络应用中无处不在,比如网上购物.网上买书.新闻app.社交网络.音乐网站.电影网站等等等等,有人的地方 ...
- 深度学习笔记 (一) 卷积神经网络基础 (Foundation of Convolutional Neural Networks)
一.卷积 卷积神经网络(Convolutional Neural Networks)是一种在空间上共享参数的神经网络.使用数层卷积,而不是数层的矩阵相乘.在图像的处理过程中,每一张图片都可以看成一张“ ...
- SIGAI深度学习第九集 卷积神经网络3
讲授卷积神经网络面临的挑战包括梯度消失.退化问题,和改进方法包括卷积层.池化层的改进.激活函数.损失函数.网络结构的改 进.残差网络.全卷机网络.多尺度融合.批量归一化等 大纲: 面临的挑战梯度消失问 ...
- 卷积神经网络CNN 手写数字识别
1. 知识点准备 在了解 CNN 网络神经之前有两个概念要理解,第一是二维图像上卷积的概念,第二是 pooling 的概念. a. 卷积 关于卷积的概念和细节可以参考这里,卷积运算有两个非常重要特性, ...
- 基于卷积神经网络的手写数字识别分类(Tensorflow)
import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_dat ...
- 【RS】Automatic recommendation technology for learning resources with convolutional neural network - 基于卷积神经网络的学习资源自动推荐技术
[论文标题]Automatic recommendation technology for learning resources with convolutional neural network ( ...
- 卷积神经网络CNN总结
从神经网络到卷积神经网络(CNN)我们知道神经网络的结构是这样的: 那卷积神经网络跟它是什么关系呢?其实卷积神经网络依旧是层级网络,只是层的功能和形式做了变化,可以说是传统神经网络的一个改进.比如下图 ...
随机推荐
- split用法
例1:基本的分割split() var str="How are you doing today?" var a=str.split(" ")//分别输出5个单 ...
- pam模块初探
- NumPy 基础用法
NumPy 是高性能科学计算和数据分析的基础包. 它是 pandas 等其他各种工具的基础. 主要功能: ndarray 一个多维数组结构, 高效且节省空间 无需循环对整组数据进行快速运算的数学函数 ...
- django admin 支持时间更改
from django.db import models import django.utils.timezone as timezone class Doc(models.Model): add_d ...
- 使用vue自定义简单的消息提示框
<style scoped> /** 弹窗动画*/ a { text-decoration: none } .drop-enter-active { /* 动画进入过程:0.5s */ t ...
- 查看进程在CPU和内存占用的命令
1.使用top命令 输入M表示按内存排序,也就是RES这一列从大到小排序了 它占用了3.3%的内存,用134568除以4030416结果就是3.3左右 也就是说 总物理内存是3.84GB RES这一列 ...
- 集合总结三(HashMap的实现原理)
一.概述 二话不说,一上来就点开源码,发现里面有一段介绍如下: Hash table based implementation of the Map interface. This implement ...
- 在Release版本下使用VLD
前提 同Debug版本在VC中配置好VLD的相关信息,拷贝 Visual Leak Detector\bin\Win32目录下所有的文件和vld.ini到工程目标路径下. 强制检测 在程序入口处的cp ...
- CSS之checkbox&radio&textarea&select
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- FlexItem 多行测试
flex: <!doctype html> <html> <head> <meta charset="utf-8"> <tit ...