使用Tensorflow从0开始搭建精灵宝可梦的检测APP

本文为本人原创，转载请注明来源链接

环境要求

Tensorflow1.12.0
cuda 9.0
python3.6.10
Android Studio
Anaconda

安装Tensorflow

使用conda 安装GPU版Tensorflow

conda install tensorflow-gpu=1.12.0
找到tensorflow的安装位置

我的位置在:home/jiading/.conda/envs/tensorflow12/lib/python3.6/site-packages/tensorflow
通过conda安装的tensorflow是不包括models这一模块的，需要从Github上下载:https://github.com/tensorflow/models

将它克隆到tensorflow文件夹下:
打开models\research\object_detection,按照https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/installation.md提示的进行安装
运行python object_detection/builders/model_builder_test.py测试是否安装成功

下载和处理数据集

我们采用的数据集是https://www.kaggle.com/lantian773030/pokemonclassification。如果你使用colab训练，可以直接将数据集下载到colab中:https://blog.csdn.net/qq_35654046/article/details/87621396

原始的数据集只有图像和类别，可以用于分类，但是用于目标检测的话需要在此基础上进一步标定数据，在图像中框出神奇宝贝的位置。

这里我们使用labelme这个软件进行标定。labelme可以直接通过pip安装:pip install labelme -i https://pypi.tuna.tsinghua.edu.cn/simp le

在终端（Bash和Windows的Powershell都可以）中直接输出Labelme即可打开软件.labelme的简单教程可以看这里:https://www.cnblogs.com/wangxiaocvpr/p/9997690.html

标定数据后，我们在各个神奇宝贝的文件夹中得到了和原图像同名的Json文件:

打开json文件，我们可以看到有很长的imageData:

这其实就是对原图像的储存，所以我们之后处理时只需要这个json文件即可，由此可以还原出原图像

如果要达到比较好的效果，要标定的数据还是不少的。

将labelme转换为voc格式

我们最终要把数据集转换为tfrecord,但是在此之前我们需要将其转换为规范的voc格式，以便于再转为tfrecord

这里我们使用Github上提供的脚本:https://github.com/veraposeidon/labelme2Datasets。这个项目的说明也是中文的，我就不多说了（可以使用我fork后修改的版本，下文有说改了哪些地方:https://github.com/JiaDingCN/labelme2Datasets)。

最后得到VOC格式的数据如下：

注意原项目的代码中有一两个小bug，这其实无伤大雅，改了就好了，但是原项目没有生成val数据集的功能，只能生成training和test.所以我改了一点：

原来的split_dataset只有test_ratio：测试集比例，我加上了'val_ratio'

注意，其实理论上可以直接用这个工具生成coco形式的数据，然后使用tensorflow中tensorflow/models/research/object_detection/dataset_tools/create_coco_tf_record.py来生成tfrecord，但在我实际使用中发现create_coco_tf_record.py制作出来的是分散的数据，如下：

当然人家在代码中也说了:Please note that this tool creates sharded output files.,是我自己没仔细看。这个格式应该也是能用的，但是我目前不知道方法，所以最后就没有用这个方法

将voc格式数据转换为tfrecord

最终我采用的是这篇博客中的代码,生成的tfrecord如下:

开始训练

这里我训练使用的是Tensorflow lite教程中推荐的COCO SSD MobileNet v1:

下载地址:http://storage.googleapis.com/download.tensorflow.org/models/tflite/coco_ssd_mobilenet_v1_1.0_quant_2018_06_29.zip

当然也可以不选择预训练模型，而是从头训练。这样的话就不需要下载上面的文件，你只需要一个config文件即可。该网络的config文件在object_detection/samples/config/ssd_mobilenet_v1_coco.config。如何配置依然可以看这篇博文:https://www.cnblogs.com/gezhuangzhuang/p/10613468.html

训练完成后，我们就可以在train_dir中看到得到的模型:

导出图

我们可以使用object_detection下的export_inference_graph.py导出图，但是对于ssd模型，官方推荐使用export_tflite_ssd_graph.py（亲测用上面的那个脚本导出的模型无法转换为tflite格式)：

python export_tflite_ssd_graph.py --input_type image_tensor --pipeline_config_path /home/jiading/Pokemon/ssd_mobilenet_v1_0.75_depth_300x300_coco14_sync.config --trained.checkpoint_prefix /home/jiading/Pokemon/train/model.ckpt-2955 --output_directory /home/jiading/Pokemon/frozen_inference_graph.pb -add_postprocessing_op True --max_detection 10

测试

我们可以使用tensorflow的object_detection自带的jupyter notebook脚本来做测试：

将PATH_TO_FROZEN_GRAPH改为pb文件的位置

需要一个labelmap文件，内容如下:

用一个脚本很容易写出来，这个就不提了

加载一张图片

运行结果

转换为tensorflow lite模型

~/.conda/envs/tensorflow12/lib/python3.6/site-packages/tensorflow/models/research/object_detection$ tflite_convert --output_file=/home/jiading/Pokemon/tflite/detect.tflite --graph_def_file=/home/jiading/Pokemon/frozen_inference_graph/tflite_graph.pb --input_arrays='normalized_input_image_tensor' --output_arrays='TFLite_Detection_PostProcess','TFLite_Detection_PostProcess:1','TFLite_Detection_PostProcess:2','TFLite_Detection_PostProcess:3' --input_shape=1,300,300,3 --allow_custom_ops

部署在安卓端

安卓的例子在ObjectDetection-Android\examples-master\lite\examples\object_detection\android下，打开后我们首先需要制作一个labelmap:

原本的例子会利用gradle下载模型，我们可以将地址替换掉

，将我们自己的这两个文件放进去:

部署时可能遇到的bug

我们可以比对自己的模型和原本的模型在输入输出上有没有区别：https://blog.csdn.net/killfunst/article/details/94301161

import numpy as np

import tensorflow as tf

# Load TFLite model and allocate tensors.

interpreter = tf.contrib.lite.Interpreter(model_path="")

interpreter.allocate_tensors()

input_details = interpreter.get_input_details()

output_details = interpreter.get_output_details()

print(input_details)

print(output_details)

像我之前在导出图时设置的--max_detection 5,但是看输出发现：

上面是我的，下面是原本模型的，改为10后再导出就没有问题了

如果还有问题，可以考虑将DetectorActivity中的private static final boolean TF_OD_API_IS_QUANTIZED设置为false。同时，如果出现维度错误，可以考虑修改TFLiteObjectDetectionAPIModel.java下的private static final int NUM_DETECTIONS

最终效果:

一点点换皮

将原项目中的图标和软件名换掉之后:

从0开始搭建精灵宝可梦的检测APP的更多相关文章

XNA 4.0 环境搭建和 Hello World，Windows Phone 游戏开发
XNA 4.0 环境搭建和 Hello World,Windows Phone 游戏开发使用 Scene 类在 XNA 中创建不同的场景(八) 摘要: 平方已经开发了一些 Windows Phone ...
从0开始搭建SQL Server AlwaysOn 第一篇（配置域控）
从0开始搭建SQL Server AlwaysOn 第一篇(配置域控) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://www.cnb ...
从0开始搭建SQL Server AlwaysOn 第二篇（配置故障转移集群）
从0开始搭建SQL Server AlwaysOn 第二篇(配置故障转移集群) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://www ...
从0开始搭建SQL Server AlwaysOn 第三篇（配置AlwaysOn）
从0开始搭建SQL Server AlwaysOn 第三篇(配置AlwaysOn) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://w ...
从0开始搭建SQL Server AlwaysOn 第四篇（配置异地机房节点）
从0开始搭建SQL Server AlwaysOn 第四篇(配置异地机房节点) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://www ...
(转) 从0开始搭建SQL Server AlwaysOn 第三篇（配置AlwaysOn）
原文地址: http://www.cnblogs.com/lyhabc/p/4682986.html 这一篇是从0开始搭建SQL Server AlwaysOn 的第三篇,这一篇才真正开始搭建Alwa ...
(转)从0开始搭建SQL Server AlwaysOn 第二篇（配置故障转移集群）
原文地址: http://www.cnblogs.com/lyhabc/p/4682028.html 这一篇是从0开始搭建SQL Server AlwaysOn 的第二篇,主要讲述如何搭建故障转移集 ...
ubantu16.04+mxnet +opencv+cuda8.0 环境搭建
ubantu16.04+mxnet +opencv+cuda8.0 环境搭建建议:环境搭建完成之后,不要更新系统(内核) 转载请注明出处: 微微苏荷一我的安装环境系统:ubuntu16.04 ...
cAdvisor0.24.1+InfluxDB0.13+Grafana4.0.2搭建Docker1.12.3 Swarm集群性能监控平台
目录 [TOC] 1.基本概念既然是对Docker的容器进行监控,我们就不自己单独搭建cAdvisor.InfluxDB.Grarana了,本文中这三个实例,主要以Docker容器方式运行. 本 ...

随机推荐

wireshark抓包实战（五），首选项设置和基本的抓包设置
一.首选项首选项一般是修改软件底层的一些默认参数选中编辑,点击首选项按钮二.抓包选项设置点击捕获,选中选项 1.捕获网卡设置 2.保存文件方式设置很多情况下wireshark会保存很大的数据 ...
Python爬虫系列（四）：Beautiful Soup解析HTML之把HTML转成Python对象
在前几篇文章,我们学会了如何获取html文档内容,就是从url下载网页.今天开始,我们将讨论如何将html转成python对象,用python代码对文档进行分析. (牛小妹在学校折腾了好几天,也没把h ...
AD颗粒化密码规则策略
我们在第一次设定密码规则的时候,通常会在根节点或者默认组策略中设置如果,我们在后期运维过程中,有一些特殊用户需要设置额外的密码策略,我们要如何操作呢? 可能,有些同学会在这些特殊用户对应的OU下在创 ...
【转】Centos7启动网卡（获取ip地址）
这里之所以是查看下IP ,是我们后面要建一个Centos远程工具Xshell 连接Centos的时候,需要IP地址,所以我们这里先学会查看虚拟机里的Centos7的IP地址首先我们登录操作系统用 ...
好玩的GeoGebra
目前,在网站上看到好多大牛写的信号方面的笔记,有很多好玩的gif好玩又让人能明白其中的原理,工欲善其事必先利其器,在写我的博客方面先来学一个好玩的数学软件吧. GeoGebra官网如图它是一个小巧的 ...
在众多小说中，Python告诉你哪本小说好看
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 有趣的Python PS:如有需要Python学习资料的小伙伴可以 ...
stand up meeting 12-9
今天项目小组本已约好在今天下午四点半进行今天的daily scrum: 但是在四点半的时候,天赋和士杰同学均因组内项目会议延时,导致今天的daily scrum只能在晚上进行,但静雯同学因身体不舒服无 ...
使用GML的八方向自动寻路
使用GML的八方向自动寻路本教程适合无基础人员使用. 提示本教程中仅使用了最简单的方法,并且有一些错误和不规范之处.请谅解一下,在评论区提出,我会修改.古人曰"教学相长",希望 ...
功能测试--聊天功能测试&微信聊天
微信聊天功能测试发送对象普通用户.公众号.群.其他特殊主体衍生功能转发.语音转文字.删除等消息发送单聊.群聊.语音.文字.图片.表情.链接.字符及长度消息管理发布通知.接受通知.发文件 ...
wechall前十题
今天开始打一打wechall 累了打wechall,不累的时候开始打buu 第一题:Get Sourced 查看源代码即可,拉到底部第二题:Stegano 属于misc的范畴,直接下载下来,然后no ...

从0开始搭建精灵宝可梦的检测APP