TensorFlow图像识别(物体分类)入门教程
本文主要介绍了如何使用TensorFlow环境运行一个最基本的图像分类器(Win10系统)。源码地址https://github.com/sourcedexter/tfClassifier/tree/master/image_classification
(这个大神好像改名了,原来叫akshaypai来着)
一.基础概念介绍
1.物体分类的思想
物体分类,也就是训练系统识别各个物体,如猫咪、狗狗、汽车等。TensorFlow是谷歌开发出的人工智能学习系统,相当于我们的运行环境。
2.神经网络与Inception v3体系结构模型
神经网络示意图如下:

通俗了讲,就是将若干个输入,进行若干次操作(线性或者非线性),最后输出结果。Inception v3模型是谷歌发布的一个深层卷积网络模型。我们使用的retrain_new.py脚本就是使用了Inception v3模型进行一个迁移学习。
3.训练集、测试集和验证集
训练集用来训练模型,验证集用来验证模型是否进行了过拟合,测试集用来测试模型的准确程度。三种图片集的比例会对准确度产生影响。
4.学习速率
不同的学习速率会导致不同的结果。如果速率过大,会导致准确率在训练的过程中不断上下跳动,如果速率过小会导致在训练结束前无法到达预期准确度。
二.环境搭建
1.Python环境搭建
具体的python搭建细节可以自行百度。参考链接:
https://blog.csdn.net/lyj_viviani/article/details/51763101
这里要注意一下版本,因为要对应后文的cuDnn库与cuda的版本。(我用的是python 3.6.4)
2.TensorFlow环境搭建(gpu)
(1)直接pip安装。命令:
pip install tensorflow-gpu
这样就安装好TensorFlow了,但是我们还需要GPU加速,所以还需要安装cuda和cuDnn(专门为deep learning准备的加速库)。
(2)cuda安装
cuda v8.0安装包下载:https://developer.nvidia.com/cuda-downloads
进行如下选择:

下载完后正常安装就可以了。
(3)cuDnn库下载
下载链接:https://developer.nvidia.com/rdp/cudnn-archive
我下载的是这个版本(cuDNN v7.0.5),这个版本要对应好cuda的版本。

下载完后解压缩,出现如下文件夹结构:

然后将这三个文件夹下的文件分别拷贝到cuda对应的文件夹下面就行了。

到这里还不能完整的运行,还需要配置一下环境变量:cuda安装完成后默认的环境变量配置不对,CUDA_PATH是C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0,但是这样不能直接访问到bin和lib\x64下的程序包,在path中加上这两个路径即可。
(4)测试
用如下代码测试:
import tensorflow as tf

hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
三.基本使用
1.数据集的收集与创建
我用的是2018全球AI挑战赛的数据集。链接:
https://challenger.ai/datasets/lad2018
下载完后,将所有文件夹都放在一个文件夹下(我自己创建了一个叫DataSet),结构如下:

文件夹的名字就是最后输出的分类的结果。
每一个文件夹下都是图片(不能再有子文件夹),即:

2.训练模型
训练模型使用retrain_new.py脚本。在命令行运行,命令格式如下:
python retrain_new.py --model_dir 存放classify_image_graph_def.pb的路径 --image_dir 刚才的创建的DataSet的路径 --output_graph 产生的,pb文件的存放路径 --output_labels 产生的output_labels.txt的 存放路径 --how_many_training_steps 训练步数 --learning_rate 学习速率 --testing_percentage 测试集比例 --validation_percentage 验证集比例
示例命令:
python retrain_new.py --model_dir E:\tfclassifier\image_classification\inception --image_dir E:\tfclassifier\DataSet --output_graph E:\tfclassifier\image_classification\output_dir\output_graph.pb --output_labels E:\tfclassifier\image_classification\output_dir\output_labels.txt --how_many_training_steps 500 --learning_rate 0.3 --testing_percentage 10 --validation_percentage 10
说明:
model_dir参数:指定了model的存放位置,就是我们的inception文件夹
image_dir参数:指定了数据集的位置
output_graph参数:产生的output_graph.pb文件的存放路径(后面要用)
output_labels 参数:产生的output_labels.txt的存放路径(后面要用)
how_many_training_steps参数:训练步数,和学习速率配合调整(我用的500)
learning_rate参数:学习速率,和训练步数配合调整(我用的0.3,常用的有0.001,0.01,0.1,0.3,1,3,可自己调整尝试一下)
testing_percentage参数:测试集比例
validation_percentage参数:验证集比例
注意:训练会在根目录下生成一个tmp文件夹,存放相关文件,即:

3.测试模型
核心的文件是output_graph.pb文件(我们训练所产生的图,是一个二进制文件)和output_labels.txt文件。
使用retrain_model_classifier.py脚本来测试模型。命令格式如下:
E:
cd E:\tfclassifier\image_classification(进入retrain_model_classifier.py脚本所在的目录)
python retrain_model_classifier.py 要识别图片的路径
例如:
python retrain_model_classifier.py D:\test2\testPic.jpg
然后会看到一些版本信息,和输出结果(红框部分):

四.遇到的问题以及解答
1.版本对应问题
Python版本,cuda版本和cuDNN版本都是对应的,如果结果中出现了乱码,很大概率是版本的问题。
2.带参数的python脚本编写与运行
想让python脚本带参数,可以在python脚本的末尾添加如下格式的代码:

运行时需要在python xxx.py后加上“--image_dir 参数”就可以了。
3.测试脚本的调整
要不断训练、测试,不断调整参数,直到训练快要结束的时候,验证比例达到稳定,并且在90以上,我们才认为系统较为完善。
五.参考链接:
深度学习动手入门:GitHub上四个超棒的TensorFlow开源项目
http://www.techweb.com.cn/news/2017-07-31/2566452.shtml
Win10 TensorFlow(gpu)安装详解
https://blog.csdn.net/sb19931201/article/details/53648615
用Inception-V3模型进行图像分类
https://blog.csdn.net/xingwei_09/article/details/79152796
谷歌机器学习速成课程
https://developers.google.cn/machine-learning/crash-course/prereqs-and-prework
TensorFlow图像识别(物体分类)入门教程的更多相关文章
- TensorFlow和深度学习入门教程(TensorFlow and deep learning without a PhD)【转】
本文转载自:https://blog.csdn.net/xummgg/article/details/69214366 前言 上月导师在组会上交我们用tensorflow写深度学习和卷积神经网络,并把 ...
- Tensorflow 2.x入门教程
前言 至于为什么写这个教程,首先是为了自己学习做个记录,其次是因为Tensorflow的API写的很好,但是他的教程写的太乱了,不适合新手学习.tensorflow 1 和tensorflow 2 有 ...
- TensorFlow 中文资源全集,官方网站,安装教程,入门教程,实战项目,学习路径。
Awesome-TensorFlow-Chinese TensorFlow 中文资源全集,学习路径推荐: 官方网站,初步了解. 安装教程,安装之后跑起来. 入门教程,简单的模型学习和运行. 实战项目, ...
- TensorFlow 中文资源精选,官方网站,安装教程,入门教程,实战项目,学习路径。
Awesome-TensorFlow-Chinese TensorFlow 中文资源全集,学习路径推荐: 官方网站,初步了解. 安装教程,安装之后跑起来. 入门教程,简单的模型学习和运行. 实战项目, ...
- 【OpenCV入门教程之十四】OpenCV霍夫变换:霍夫线变换,霍夫圆变换合辑
http://blog.csdn.net/poem_qianmo/article/details/26977557 本系列文章由@浅墨_毛星云 出品,转载请注明出处. 文章链接:http://blog ...
- GAN网络之入门教程(四)之基于DCGAN动漫头像生成
目录 使用前准备 数据集 定义参数 构建网络 构建G网络 构建D网络 构建GAN网络 关于GAN的小trick 训练 总结 参考 这一篇博客以代码为主,主要是来介绍如果使用keras构建一个DCGAN ...
- caffe_实战之两个简单的例子(物体分类和人脸检测)
一.物体分类: 这里使用的是caffe官网中自带的例子,我这里主要是对代码的解释~ 首先导入一些必要的库: import caffe import numpy as np import matplot ...
- WebGL入门教程(五)-webgl纹理
前面文章: WebGL入门教程(一)-初识webgl WebGL入门教程(二)-webgl绘制三角形 WebGL入门教程(三)-webgl动画 WebGL入门教程(四)-webgl颜色 这里就需要用到 ...
- Objective-C 30分钟入门教程
Objective-C 30分钟入门教程 我第一次看OC觉得这个语言的语法有些怪异,为什么充满了@符号,[]符号,函数调用没有()这个,但是面向对象的高级语言也不外乎类,接口,多态,封装,继承等概念. ...
随机推荐
- Node.js实战(九)之事件循环
Node.js 是单进程单线程应用程序,但是因为 V8 引擎提供的异步执行回调接口,通过这些接口可以处理大量的并发,所以性能非常高. Node.js 几乎每一个 API 都是支持回调函数的. Node ...
- .NET批量操作窗口样式
1. 背景 我们在开发过程中,可能会遇到需要批量控制程序中窗体的大小或其它一些操作, 这些窗体有可能是属于程序本身的,也许是其它程序的窗口.本文就是基于此的一篇关于如何批量操作窗口样式的,我们主要是通 ...
- 【转】深入理解C++的动态绑定和静态绑定 & 不要重定义虚函数中的默认参数
为了支持c++的多态性,才用了动态绑定和静态绑定.理解他们的区别有助于更好的理解多态性,以及在编程的过程中避免犯错误.需要理解四个名词:1.对象的静态类型:对象在声明时采用的类型.是在编译期确定的.2 ...
- office2016word 每次打开都有进度条问题 解决方式
最佳答案 每次打开Office 2016都提示配置进度(包括Word.PPT.Excel等等Office产品都有这种现象),如图,先是显示“安装程序正在准备必要的文件”,接着显示“正在配置Mi ...
- Docker学习笔记 — 开启Docker远程访问
默认情况下,Docker守护进程会生成一个socket(/var/run/docker.sock)文件来进行本地进程通信,而不会监听任何端口,因此只能在本地使用docker客户端或者使用Docker ...
- spring-boot dubbo项目使用docker方式部署
项目结构 本项目采用maven构建,有三个模块,分别是pms-interfaces, pms-services, pms-portal. 模块 描述 pms-interfaces 接口层,只能存放实体 ...
- 在 R 中估计 GARCH 参数存在的问题(续)
目录 在 R 中估计 GARCH 参数存在的问题(续) rugarch 包的使用 简单实验 rugarch 参数估计的行为 极端大样本 结论 在 R 中估计 GARCH 参数存在的问题(续) 本文承接 ...
- Android开发——进程间通信之Messenger
0. 前言 不论是Android还是其他操作系统,都会有自己的IPC机制,所谓IPC(Inter-Process Communication)即进程间通信.首先线程和进程是很不同的概念,线程是CPU ...
- switch语句的执行过程
switch语句的执行规则如下: 1.从第一个case开始判断,不匹配则跳到下一个case继续判断: 2.遇到break则跳出switch语句: 3.default一般是没有匹配项才执行的,一般是放在 ...
- STM32之HAL库、标准外设库、LL库
标准外设库(Standard Peripherals Library),应该是最早推出的版本,以前用STM32F103的时候,用的多 HAL(Hardware Abstraction Layer),硬 ...