zxing源码分析——QR码部分

2013-07-10 17:16:03|  分类: 默认分类 |  标签: |字号大中小 订阅

 
 
Java代码结构:

zxing源码的结构还是比较清晰的,有关QR码的代码主要在以下几个package中。Java代码中有生成QR码的代码,在C++代码中是没有生成部分,只有解析部分。

其中qrcode中是编解码的接口,外部代码通过这两个类来进行QR码的编解码。
detector是用来在摄像头抓取的图像中检测出QR码的那部分,并将其提取出来。这部分代码是解码的关键,也是可以进行优化的部分。
decoder是按照QR码的编码规范将之前detector中提取出的QR码符号进行解码操作,将图像解析为真实的信息。
QR码解码流程:

1、将图像进行二值化处理,1、0代表黑、白。

2、寻找定位符、校正符,然后将原图像中符号码部分取出。(detector代码实现的功能)
3、对符号码矩阵按照编码规范进行解码,得到实际信息(decoder代码实现的功能)
二值化:
zxing中条码的二值化都是使用
Binarizer实现,一维码使用getBlackRow方法,
二维码的使用getBlackMatrix方法。
Binarizer有两个生成类,
GlobalHistogramBinarizer和HybridBinarizer;这两个类对
getBlackMatrix方法的实现有不同

HybridBinarizer中的实现对于某些条件下的图像有些特殊的处理,暂时没有看懂,这里只介绍
GlobalHistogramBinarizer中二值化的方法。
二值化的关键就是定义出黑白的界限,我们的图像已经转化为了灰度图像,每个点都是由一个灰度值来表示,就需要定义出一个灰度值,大于这个值就为白(0),低于这个值就为黑(1)。在
GlobalHistogramBinarizer中,是从图像中均匀取5行(覆盖整个图像高度),每行取中间五分之四作为样本;以灰度值为X轴,每个灰度值的像素个数为Y轴建立一个直方图,从直方图中取点数最多的一个灰度值,然后再去给其他的灰度值进行分数计算,按照点数乘以与最多点数灰度值的距离的平方来进行打分,选分数最高的一个灰度值。接下来在这两个灰度值中间选取一个区分界限,取的原则是尽量靠近中间并且要点数越少越好。界限有了以后就容易了,与整幅图像的每个点进行比较,如果灰度值比界限小的就是黑,在新的矩阵中将该点置1,其余的就是白,为0。
提取符号码:
这部分是解码的关键部分,解码能力的高低也主要体现在这里(不过我感觉二维码本身设计的就比较好,对图像扭曲变形的纠错能力比较高,所以代码部分对这方面的处理就比较少)。这部分的目标是从像素为单位的原始图像中提取出符号码部分,并转换为模块为单位的符号码矩阵。
将二值化之后的矩阵交给Detector,其detect方法就是接口方法。调用这个方法就会返回取好的符号码矩阵。下面详细介绍detect方法所做的工作:

1、寻找定位符

寻找定位符是FinderPatternFinder这个类来实现的。
在图像中每隔iSkip就采样一行,

int iSkip = (3 * maxI) / (4 * MAX_MODULES);

在这一行中将连续的相同颜色的像素个数计入数组中,数组长度为5位,即去找黑\白\黑\白\黑的图像(如开始检测到黑色计入数组[0],直到检测到白色之前都将数组[0]的值+1;检测到白色了就开始在数组[1]中计数,以此类推)。填满5位后检测这5位中像素个数是否比例为1:1:3:1:1(可以有50%的误差范围),如果满足条件就说明找到了定位符的大概位置,将这个图像交给handlePossibleCenter方法去找到定位符的中心点,方法是先从垂直方向检测是否满足定位符的条件,如满足就定出Y轴的中心点坐标值,然后用这个坐标值去再次检测水平方向是否满足定位符条件,如满足就定出X轴的中心点坐标值。至此就找到了一个定位符的中心坐标。

按照上面所说的步骤找出所有三个定位符的中心坐标,接下来开始定位三个定位符在符号中的位置,即左上(B点)、左下(A点)、右上(C点)三个位置。先通过两两之间的距离定出哪个是左上那一点(左上那点到其他两点的距离应该相差不远),然后通过计算BA、BC向量的叉乘定出A和C两点。
2、寻找校正符
通过ABC三点的坐标计算出校正符的可能位置,然后交给AlignmentPatternFinder去寻找最靠近右下角的那个校正符,寻找方法与寻找定位符的方法基本相同,如果找到就返回校正符的中心坐标,如果没有找到也没关系,解码程序可以继续。
3、透视转换,生成最终矩阵
找到了三个定位点和一个校正符的坐标(校正符没有找到可以用一个计算值来代替),符号图像的位置就已经确定了,现在要进行图像变形,建立起以模块为单位的符号矩阵与原图像之间的关系,使用的方法是George Wolberg写的Digital Image Warping一书中PerspectiveTransform方法(书中54-56页)。转换关系确立了就将新矩阵(以模块为单位的符号矩阵)中每一个点对应到原图像中的点,去看该点是黑是白,并将0、1置填充到矩阵中。这样就生成了最终的符号码。
解码QR符号码:
有了符号码矩阵就按照QR码的编码规范去进行解码。这部分功能是Decode类实现的。
先获取版本信息,然后获取到格式信息,从格式信息中取得纠错等级。然后去读码字,读码字的方法很简单,从右下角开始,两列为单位,从最后一行开始,先向上读,读到顶端再向下,这样依次读完整个图像(详细参见QR码编码规范ISO16022-2006)。然后将所有码字还原回block,进行RS纠错,然后形成一个二进制流交给DecodedBitStreamParser解析成真实的信息。
至此,解码过程结束

zxing源码分析——QR码部分的更多相关文章

  1. ffplay源码分析3-代码框架

    ffplay是FFmpeg工程自带的简单播放器,使用FFmpeg提供的解码器和SDL库进行视频播放.本文基于FFmpeg工程4.1版本进行分析,其中ffplay源码清单如下: https://gith ...

  2. 学习:二维码、QR码、J4L-QRCode、java

    开源码 Java 解码器(编码解码)下载:http://sourceforge.jp/projects/qrcode/downloads/28391/qrcode.zip Java QR Code O ...

  3. C#利用QrCode.Net生成二维码(Qr码

    http://www.cnblogs.com/Soar1991/archive/2012/03/30/2426115.html 现在网上很多应用都是用二维码来分享网址或者其它的信息.尤其在移动领域,二 ...

  4. C#利用QrCode.Net生成二维码(Qr码)

    在网上很多应用都是用二维码来分享网址或者其它的信息.尤其在移动领域,二维码更是有很大的应用场景.因为项目的需要,需要在网站中增加一个生成二维码分析网址的功能,在谷歌大幅度抽筋的情况下无奈使用百度.百度 ...

  5. js-jquery-003-条形码-二维码【QR码】

    一.基本使用 插件地址:https://github.com/jeromeetienne/jquery-qrcode 1.首先在页面中加入jquery库文件和qrcode插件. <script ...

  6. 二维码,QR码,编码原理与实现

    文章更新于:2020-02-18 注:开头是四篇文章的链接,下面是这四篇文章的截图 # 想了解二维码,读这几篇就够了 # 二维码的基础原理是什么 https://cli.im/news/help/10 ...

  7. Atitit zxing二维码qr码识别解析

    Atitit zxing二维码qr码识别解析 1.1. qr码识别解析 by zxing1 1.2. 解码lib:qrcode.jar  2 1.3. atitit.二维码生成总结java zxing ...

  8. ffplay源码分析5-图像格式转换

    本文为作者原创,转载请注明出处:https://www.cnblogs.com/leisure_chn/p/10311376.html ffplay是FFmpeg工程自带的简单播放器,使用FFmpeg ...

  9. ffplay源码分析6-音频重采样

    本文为作者原创,转载请注明出处:https://www.cnblogs.com/leisure_chn/p/10312713.html ffplay是FFmpeg工程自带的简单播放器,使用FFmpeg ...

随机推荐

  1. 查看oracle锁及解决办法

    SQL> select t2.username,t2.sid,t2.serial#,t2.logon_time from v$locked_object t1, v$session t2 whe ...

  2. c++ :OOP之静态类型与动态类型

    所谓静态类型即类型指针或引用的字面类型:而动态类型即类型指针或引用的实际类型. 这一对概念一般发生在基类和派生类之间. 如: class Base { ..... } class Derived : ...

  3. 设计模式之观察者模式(Java)

    设计模式(Design pattern)是什么?它是一套由四人组(The Gang of Four, [1]的作者)总结出来的软件设计框架.其目的是为了提高代码的可重用性,增强系统的可维护性和代码的易 ...

  4. WebApp 里Meta标签大全

    1.先说说mate标签里的viewport: viewport即可视区域,对于桌面浏览器而言,viewport指的就是除去所有工具栏.状态栏.滚动条等等之后用于看网页的区域.对于传统WEB页面来说,9 ...

  5. mysql 查询重复的(不区分大小写)数据的SQL优化

    在mysql中查询不区分大小写重复的数据,往往会用到子查询,并在子查询中使用upper函数来将条件转化为大写.如: select * from staticcatalogue WHERE UPPER( ...

  6. Http Analyzer 数据抓包

    一.工具简介 这是一款实时分析 HTTP/HTTPS 数据流的工具.它可以实时捕捉HTTP/HTTPS 协议数据,可以显示许多信息(包括:文件头.内容.Cookie.查询字符窜.提交的数据.重定向的U ...

  7. python计算md5值

    from hashlib import md5 m = md5(') print m.hexdigest()

  8. Oracle EBS-SQL (BOM-9):检查系统BOM总数.sql

    SELECT      ITM.SEGMENT1                         物料编码     ,ITM.DESCRIPTION                     物料描述  ...

  9. Oracle 导出HTML

    http://www.linuxidc.com/Linux/2010-10/29133.htm Oracle 执行计划: http://czmmiao.iteye.com/blog/1471756 h ...

  10. SEO高手在扯蛋?

    真正的高手SEO你在扯蛋吗?当大家都很会扯的时候,高手扯得肯定比你疼,不是他们 蛋比较敏感,而是他们的确更用力. 当你说我是SEO时,高手肯定说现在我在做的是SEM. 当你说我是SEM时,高手肯定在说 ...