TechDay公开课实录:PaddlePaddle车牌识别实战和心得

　　车牌识别作为一种常见的图像识别的应用场景，已经是一个非常成熟的业务了，在传统的车牌识别中，可以使用字符分割+字符识别的方式来进行车牌识别，而深度学习兴起后，出现了很多端到端的车牌识别模型，不用分割字符，直接输入车牌图片即可识别出车牌字符。2019年1月5日百度深度学习线下技术公开课PaddlePaddle TechDay第一期演讲则邀请了百度认证布道师胡晓曼老师分享基于PaddlePaddle最新版本Fluid作用于车牌识别模型训练的实践。
　　
　　以下为胡晓曼讲师的演讲实录：
　　
　　PaddlePaddle Fluid和TensorFlow的设计理念有何不同？
　　
　　执行流程不是“先定义再执行”，而是“先编译再运行”，通过写一个 Transpiler把Protobuf Message翻译成C++程序，然后用NCVV、ICC、GCC编译成二进制代码，可以直接运行在服务器和手机上。
　　
　　抛弃静态图思想，采用Program设计思想，原始的Program在平台内部转换成ProgramDesc，python的Executor接收ProgramDesc后，传递给Transpiler，输出一段C++可执行的Program。
　　
　　基于此，Fluid解释器极大的加快了执行Program的速度，PaddlePaddle Fluid运行速度也会更快。
　　
　　按步骤来，你也能创造自己的车牌识别数据集
　　
　　1.数据准备
　　
　　数据准备是做训练的第一步，往往大家第一印象都是去网上下载车牌数据集，但是会有很多问题，如数据集不方便下载，大部分需要花钱等等。但其实除了收集真实场景的车牌数据，我们也可以自己用程序的方式生成车牌数据：
　　
　　1.1生成车牌数据
　　
　　1.1.1定义车牌所需字符
　　
　　1.1.2生成中英文字符
　　
　　一个车牌第一个字母都是中文，后面是英文和数据集合。
　　
　　1.1.3数据增强：添加畸变、噪音和模糊处理
　　
　　字符生成后，需要对车牌数据进行一些数据增强，因为直接生成的数据是非常干净和清晰的车牌数据，跟真实场景的数据有一定差距，直接拿来用的训练结果会非常好，但是自然场景里，噪音、畸变、模糊等问题会影响真实图片的效果，最后实际应用依然达不到预期。因此，我们需要对这些数据进行畸变、噪音、模糊处理，尽量贴近现实场景的图片。
　　
　　1.1.4生成车牌背景——加入背景图片，生成车牌字符串list和label，并存为图片格式。
　　
　　车牌目前有蓝牌、绿牌、白牌、黑牌，常见的是蓝牌和绿牌，车牌数字搞定后需要加入背景图片，使其跟真实车牌更相近。
　　
　　1.1.5批量生成
　　
　　生成字符后加入背景图片，用函数的使其可以批量生成，做测试最好生成数量越多越好，起码几十万张起。
　　
　　1.2.6车牌生成效果
　　
　　2.Fluid数据读取
　　
　　支持两种传入数据的方式：
　　
　　以PythonReader同步读取方式为例（注：batch_size：Fluid中Tensor的第0维度固定为batch_size，在上面代码段中，图像输入x的形状为[3,32,32]，分别代表：channel数目，图像的高度和宽度。如果不指定batch_size，那么data算子会根据实际数据来推断batch_size的大小，如果需要自定义batch_size，就需要在第0维指定维度即可）：
　　
　　3.Fluid网络模型
　　
　　采用PaddlePaddle Fluid提供的vgg19模型来进行训练，完整代码请见：
　　
　　这个模型的好处是把vgg9所有的网络模型都写进去了。
　　
　　4.启动训练-参数初始化
　　
　　启动训练的时候如何进行参数初始化，可以选择是否使用GPU。初始化完成后，需要把数据灌进来，启动数据模型并输入数据。
　　
　　5.模型测试并输出日志
　　
　　打印日志
　　
　　打印的日志，pass表示第一次迭代，batch表示第一次batch，Loss是第一次迭代，第一次迭代里面是98，acc是0.08，一直迭代到后面，loss值在不断的下降。Loss值不断下降可以画成一张图，根据它下降的幅度，可以帮助我们侦查这个模型训练是否有问题。
　　
　　保存模型
　　
　　创建一个保存模型的路径，通过调用Fluidio这个模块，将这个模型保存下来。
　　
　　6.预测模型
　　
　　保存好的模型不一定要在这台机器上使用，在其他机器和容器里面，也是可以进行使用的。提前将这个网络和模型加载进来，放入测试数据，就可以进行测试，预测模型。
　　
　　预测结果（测试图片）
　　
　　这张图片是预测的新能源的车牌图片，豫GD17926，预测之后把模型加载进来，测试图片，结果是豫GD17826，9变成8，没有想象中的效果好，原因是只迭代了2000次，没有迭代太多的时间，如果模型并没有完全收敛，大家可以在自主构建过程当中，增加迭代次数，看是否能够达到收敛的状态。当然，实际应用落地中，还是要看具体的业务场景。
　　
　　最后，晓曼老师也根据自身经验，给初学者提出几点关于深度学习的建议：
　　
　　1.不要过于追求高大上的模型和数学名词，做工业应用实践，要做好最基本的工作，不要深究理论；
　　
　　2.不要随便调参，理论有助于我们懂得如何更快速、更高效调参，使其以最快的方式达到最优的状态；
　　
　　3.不要只依赖机器，机器的资源是有限的，我们更应该考虑如何把模型进行性能优化，这样可以加速模型进行训练；
　　
　　4.提高工程能力，多看代码，多写代码，论文多复现，以此提高自己的工程能力。
　　
　　//seekbarLayout 是seekBar对象statusSeekbar的父层布局
　　
　　seekbarLayout = mStatusViewLayout.findViewById(R.id.id_seekbar_layout);
　　
　　seekbarLayout.setOnTouchListener(new View.OnTouchListener() {
　　
　　@Override
　　
　　public boolean onTouch(View v, MotionEvent event) {
　　
　　Rect seekRect = new Rect(www.meiwanyule.cn/ );
　　
　　statusSeekbar.getHitRect(seekRect);
　　
　　if ((event.getY() >= (seekRect.top - 500)) && (event.getY() <= (seekRect.bottom + 500))) {
　　
　　float y = seekRect.top + seekRect.height(www.gcyL157.com) / 2;
　　
　　//seekBar only accept relative x
　　
　　float x = event.getX(www.mcyllpt.com) - seekRect.left;
　　
　　if (x < 0) {
　　
　　x = 0;
　　
　　} else if (x > seekRect.width(www.michenggw.com)) {
　　
　　x = seekRect.width();
　　
　　}
　　
　　MotionEvent me = MotionEvent.obtain(event.getDownTime(), event.getEventTime(),
　　
　　event.getAction(www.fengshen157.com/), x, y, event.getMetaState());
　　
　　return statusSeekbar.onTouchEvent(me);
　　
　　}
　　
　　return false;
　　
　　}
　　
　　});

TechDay公开课实录:PaddlePaddle车牌识别实战和心得的更多相关文章

【深度学习系列】用PaddlePaddle进行车牌识别（一）
小伙伴们,终于到了实战部分了!今天给大家带来的项目是用PaddlePaddle进行车牌识别.车牌识别其实属于比较常见的图像识别的项目了,目前也属于比较成熟的应用,大多数老牌厂家能做到准确率99%+.传 ...
张小龙在2017微信公开课PRO版讲了什么（附演讲实录和2016微信数据报告）
今天2017微信公开课PRO版在广州亚运城综合体育馆举行,这次2017微信公开课大会以“下一站”为主题,而此次的微信公开课的看点大家可能就集中在腾讯公司高级副总裁.微信之父——张小龙的演讲上了!今天中 ...
Swift项目开发实战-基于分层架构的多版本iPhone计算器-直播公开课
Swift项目开发实战-基于分层架构的多版本iPhone计算器-直播公开课本课程采用Q Q群直播方式进行直播,价值99元视频课程免费直播.完整的基于Swift项目实战,手把手教你做一个Swift版i ...
【深度学习】用PaddlePaddle进行车牌识别（二）
上节我们讲了第一部分,如何用生成简易的车牌,这节课中我们会用PaddlePaddle来识别生成的车牌. 数据读取在上一节生成车牌时,我们可以分别生成训练数据和测试数据,方法如下(完整代码在这里): ...
【深度学习系列】用PaddlePaddle进行车牌识别（二）
上节我们讲了第一部分,如何用生成简易的车牌,这节课中我们会用PaddlePaddle来识别生成的车牌. 数据读取在上一节生成车牌时,我们可以分别生成训练数据和测试数据,方法如下(完整代码在这里): ...
AI研讨会直播：《人工智能开发前沿》实战系列公开课第1期
报名链接:https://www.slidestalk.com/m/276 活动背景业务需求.数据.算法.算力等因素,决定人工智能技术走向产业落地面临各种挑战.博客园联合示说网以及产业内人工智能技术 ...
人工智能头条（公开课笔记）+AI科技大本营——一拨微信公众号文章
不错的 Tutorial: 从零到一学习计算机视觉:朋友圈爆款背后的计算机视觉技术与应用 | 公开课笔记分享人 | 叶聪(腾讯云 AI 和大数据中心高级研发工程师) 整理 | Leo 出 ...
kali 在线教学群第一次公开课小结（1）
kali 在线教学群第一次公开课小结(1) 文/玄魂 1.1 需要准备的基础环境 vmware 虚拟机,kali 2.0 镜像,科学上网工具包.这三项内容,可以在本人的微信订阅号“xuanhun ...
Andrew Ng机器学习公开课笔记 -- Regularization and Model Selection
网易公开课,第10,11课 notes,http://cs229.stanford.edu/notes/cs229-notes5.pdf Model Selection 首先需要解决的问题是,模型 ...

随机推荐

zedboard学习（1）OLED驱动显示图像
1. 干点啥?驱动一下上面的屏吧 2. 找个代码研究一下,cat命令用于读取文件(普通文件或设备文件)的内容并进行输出.据说板子已经做好OLED的驱动了,驱动映射为/dev/zed_oled,所以直接 ...
cogs1713 [POJ2774]很长的信息
cogs1713 [POJ2774]很长的信息原题链接题解把两串拼成A+'%'+B+'$'.跑后缀数组然后相邻两点i,i+1不在同一串里就用ht[i]更新答案. 好裸... Code // It ...
一步步带你配置IIS（包括错误分析）
今天趁着工作中的问题一下子来解决IIS配置发布网站:点击VS发布网站第一步:新建配置文件(我取名为webSite) : 第二步:选择发布方法并且选择把文件发布到哪里(比喻在D盘创建一个文件夹web ...
Windows环境下php开启GD库的方法
一.GD库是什么? GD库是php处理图形的扩展库,GD库提供了一系列用来处理图片的API,使用GD库可以处理图片,或者生成图片,也可以给图片加水印.在网站上GD库通常用来生成缩略图,或者用来对图片加 ...
理解学习Springboot（二）
一.关闭banner 如果不想看到任何的banner,可以将其关闭. 当然也可以自己自定义banner,http://patorjk.com/software/taag/#p=display& ...
在Unity中使用带碰撞体的TiledMap
虽然最近Unity2018版本推出了自己的瓦片地图,但是这个瓦片地图有点BUG,在场景内把瓦片地图铺好做成预制体,动态生成的时候居然丢失了碰撞体,于是我决定还是使用Tiled软件绘制地图并使用Tile ...
Linux安装JDK8详细步骤
1.下载jdk8 查看Linux位数,到oracle官网下载对应的jdk ① sudo uname --m 确认32位还是64位 ② https://www.oracle.com/technetwo ...
Linux下使用vim编辑C程序
这几天在系统能力班自学linux,加上最近大数据课上开始使用linux,我在这里总结一下,linux下使用vim编辑c程序的一些问题. 大数据课上是直接使用micro来编辑的,我这里只是简单的说明一下 ...
java沙盒入门（2)
Java在Internet上的应用已经日渐普遍,使用在网页上的Java程序称之为applet,利用Applet的嵌入能够使原本静态的HTML富有变化,并且能够做到"声"." ...
n元一维向量向左循环移位i的几种算法
1.最简单的算法借助于一个n元的中间向量在n步时间内完成时间复杂度:O(n) 空间复杂度O(n) void shift_easy(int arr[], int _arr[], int n, int ...

TechDay公开课实录:PaddlePaddle车牌识别实战和心得

TechDay公开课实录:PaddlePaddle车牌识别实战和心得的更多相关文章

随机推荐

热门专题