博客第一篇文章,稍作修改,增加文字介绍


  开发目的

    最近由于某些需求,需要在Android手机端实现OCR功能,大致为通过手机照相,识别出相片中的中文信息字段。但是由于新手光环+流程不熟悉,遇到了各种各样的问题,准备在本文中叙述一下,最好能派上用场。

  开发环境

    Android studio 2.3.3  Windows下,测试手机Android4.4版本

  环境搭建

    搭建安卓OCR开发环境. 

    使用的google提供的OCR识别引擎,可以选择多种语言。

    参考上述链接可以实现,最开始的搭建。这里需要注意的是:由于GitHub上的工程与当前新建的Gradle版本不匹配,导致android-maven错误,注意添加依赖。

  大文件拷贝

    由于OCR训练好的文件比较大,以中文识别为例,50MB左右大小,需要将文件放置于手机的SD卡中,便于TessBaseApi对象初始化。(init()函数需要文件路径,目前没想到更好的方式)。

  本文提出的解决方式:首先将chi_sim.traineddata文件放入asset文件夹中。在程序首次运行的时候,将文件拷贝到SD卡中,注意获取SD卡读写权限。拷贝函数如下:

  加入相机

  以上步骤顺利的话,可以实现对图片的文字进行识别功能。为了实现对照相机得到的相片进行识别,需要打开摄像机。

Intent getImageByCamera = new Intent(MediaStore.ACTION_IMAGE_CAPTURE);
startActivityForResult(getImageByCamera,REQUST_ORIGINAL);

  REQUST_ORIGINAL是自己定义的常量值,用于接收时,与requestcode值比对,判断是否为需要的数据。

  

 @Override
protected void onActivityResult(int requestCode, int resultCode, Intent data) {
super.onActivityResult(requestCode, resultCode, data);
if (resultCode == Activity.RESULT_OK && requestCode == REQUST_ORIGINAL){
   Bundle bdl = data.getExtras();
Bitmap bmp = (Bitmap) bdl.get("data");
ImageView im_camera = (ImageView)findViewById(R.id.img_camera);
im_camera.setImageBitmap(bmp);
mTess.clear();
mTess.setImage(bmp);
String result = mTess.getUTF8Text();
TextView txtget = (TextView)findViewById(R.id.txt_get);
txtget.setText(result);
}
}

  在回调函数里,处理返回的图片数据,就可以实现初步的图片文字识别。但是这样返回的图片数据为缩略图,清晰的很低。如果想要对原始图片进行处理的话,需要换一种图片获取的方式。

首先,调用相机的时候,添加图片为文件存储的路径。

  Intent getImageByCamera = new Intent(MediaStore.ACTION_IMAGE_CAPTURE);
Uri uri;
if(Build.VERSION.SDK_INT>=24)
{
File g= new File(picPath);//测试错误
try {
g.createNewFile();
} catch (IOException e) {
e.printStackTrace();
}
uri = FileProvider.getUriForFile(this,"xueyu404",g);
}else{
uri = Uri.fromFile(new File(picPath));
} getImageByCamera.putExtra(MediaStore.EXTRA_OUTPUT,uri);
startActivityForResult(getImageByCamera,REQUST_ORIGINAL);

  PicPath为String变量,意义为相机图片在sd卡上的存储路径。然后在回调函数里对图片进行处理。

由于Android 7.0在跨应用数据调用增加了限制,需要使用FileProvider获取uri,具体FileProvider配置参考一下链接

http://blog.csdn.net/hehe26/article/details/52921056

 if (resultCode == Activity.RESULT_OK && requestCode == REQUST_ORIGINAL){
FileInputStream fis = null;
try{
Log.e("sdpath2",picPath);
fis = new FileInputStream(picPath);
Bitmap bm = BitmapFactory.decodeStream(fis);
ImageView im_camera = (ImageView)findViewById(R.id.img_camera);
im_camera.setImageBitmap(bm);
mTess.setImage(bm );
String result = mTess.getUTF8Text();
TextView txtget = (TextView)findViewById(R.id.txt_get);
txtget.setText(result);
}catch (FileNotFoundException e){
e.printStackTrace();
}finally {
try {
fis.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
else {
Toast.makeText(this,"没有拍到照片",Toast.LENGTH_SHORT).show();
}

    运行效率

    通过上述的过程,可以完成,基本的文字识别的功能。但仍然存在着不能忽略的问题。

    一,使用缩略图进行识别的时候,运行速率可以接受,对于特别大的文字识别还可以。但是由于图片被压缩过,如果图片中存在比较小的文字基本不能识别。

    二,使用后面提到的原始图片进行识别的话,由于手机的计算能力有限,识别的计算过程相当耗时。识别过程要放到另外的线程中单独运行,否则会卡死UI线程,假死。但是即使新建线程,需要的时间也远超用户的忍耐限度。

    改进优化

    由于图片原图比较大的原因,对整个图片进行识别的效果也不理想。所以本文建议在拍摄照片之后,用户用手指圈定识别区域文字。圈定区域 的控件,见我的另外一篇博客

    Android 通过触摸动态地在屏幕上画矩形

    此外,识别过程,控件初始化过程比较耗时,放置在UI线程中卡顿不可忍耐。本文采用线程池的方式,处理上述两个过程。

    最终效果图

    

      先点击相机拍照按钮,拍要识别的照片,再点击选取区域按钮,用手指画一个矩形框,圈好识别区域(如果矩形没画好可以再点击选取区域重新画),

最后点击文字识别等待结果显示。

工程代码链接:https://github.com/dutxueyu/Android_ocr_app

  

Android studio ocr初级app开发问题汇总(含工程代码)的更多相关文章

  1. android软件简约记账app开发day04-记账页面条目的代码书写

    android软件简约记账app开发day04-记账页面条目的代码书写 在前三天我们完成了基本的界面展示,从今天开始,我们进入到后台逻辑代码的编写中,今天开发记账条目的代码 我们在主页面点击记一笔图标 ...

  2. Android Studio搭建系统App开发环境

    一.前言 在Android的体系中开发普通app使用Android Studio这一利器会非常的方便.但是开发系统app可能就会有些吃力,不过经过一些配置仍然会 很简单.我们知道系统app因为涉及到一 ...

  3. 在Android studio中进行NDK开发

     在Android studio中进行NDK开发  分类: Android平台 软硬件环境 ubuntu kylin 14.04 红米note增强版 Android studio 0.8.6 ndk ...

  4. Android进阶(十九)AndroidAPP开发问题汇总(三)

    Android进阶(十九)AndroidAPP开发问题汇总(三) Java解析XML的几种方式: http://inotgaoshou.iteye.com/blog/1012188 从线程返回数据的两 ...

  5. Android Studio入门(安装-->开发调试)

    写在前面的话:本文来源:http://blog.csdn.net/yanbober/article/details/45306483 目标:Android Studio新手–>下载安装配置–&g ...

  6. 如何将Android Studio与华为软件开发云代码仓库无缝对接(二)

    上篇文章:如何将Android Studio与华为软件开发云代码仓库无缝对接(一) 上一章讲了,如何用Android Studio以软件开发云代码仓库为基础,新建一个项目.接下来,这一章继续讲建好项目 ...

  7. Android进阶(二十)AndroidAPP开发问题汇总(四)

    · Android进阶(二十)AndroidAPP开发问题汇总(四) android:layout_width和android:width的区别 基中的android:layout_width和and ...

  8. Android进阶(十八)AndroidAPP开发问题汇总(二)

    Android进阶(十八)AndroidAPP开发问题汇总(二) 端口被占用解决措施: Android使用SimpleAdapter更新ListView里面的Drawable元素: http://ww ...

  9. 【Android Studio安装部署系列】二十八、Android Studio查看其它APP的布局结构

    概述 日常使用别家的APP过程中,会遇到一些比较好看的布局,这时候我们就想学习一下别人的布局结构,以便参考. (1)手机连接电脑.设置手机为USB调试模式 参考<[Android Studio安 ...

随机推荐

  1. 图说使用socket建立TCP连接

    在网络应用如火如荼的今天,熟悉TCP/IP网络编程,那是最好不过.如果你并不非常熟悉,不妨花几分钟读一读. 为了帮助快速理解,先上个图,典型的使用socket建立和使用TCP/UDP连接过程为(截图来 ...

  2. Windows下编程--模拟时钟的实现

    windows下编程--模拟时钟的实现: 主要可以分为几个步骤: (1)   编写按键事件处理(启动和停止时钟) (2)   编写时钟事件处理,调用显示时钟函数 (3)   编写显示时钟函数,要调用显 ...

  3. Spring---AOP与DI的初步理解

    依赖注入 依赖注入并没有我们听上去那么复杂,在项目中应用依赖注入,会使代码变的异常简单,更易于理解和测试. 任何一个有实际意义的应用,都是多个类组成,这些类之间相互协作,来实现特定的业务逻辑,通常,每 ...

  4. HTML5--(2)属性选择器+结构性伪类+伪类

    一.属性选择器 [att] 匹配所有具有att属性的 [att=val] 匹配所有att属性等于“val”的 [att~=val] 匹配所有att属性包含“val”或者等于“val”的(val必须是一 ...

  5. spring boot2.0

    1. Spring boot 简介 1.1 spring boot的三大特性 组件自动装配:Web mvc, Web Flux,JDBC等 激活:@EnableAutoConfiguration 配置 ...

  6. 撩课-Java每天10道面试题第4天

    撩课Java+系统架构 视频 点击开始学习 31.静态变量和实例变量的区别? 静态变量也叫类变量, 这种变量前加了static修饰符. 可以直接用类名调用, 也可以用对象调用, 而且所有对象的同一个类 ...

  7. mybatis问题: There is no getter for property named 'equipmentId' in 'class java.lang.String'

    本文来源于翁舒航的博客,点击即可跳转原文观看!!!(被转载或者拷贝走的内容可能缺失图片.视频等原文的内容) 若网站将链接屏蔽,可直接拷贝原文链接到地址栏跳转观看,原文链接:https://www.cn ...

  8. GString惰性求值

    当对一个GString实例求值时,如果其中包含一个变量,该变量的值会被简单地打印到一个Writer,通常是一个StringWriter.然而,如果GString中包含的是一个闭包,而非变量,该闭包就会 ...

  9. Ubuntu 16.04安装Oracle 11gR2入门教程图文详解

    概述 Ubuntu版本:ubuntu-16.04.3-desktop-amd64 Oracle版本:linux.x64_11gR2_database ------------------------- ...

  10. 使用TreeDMS进行MySQL数据库的Web页面远程管理

    在互联网应用蓬勃发展的时代背景下,各种各样的网络平台,网络应用,移动应用层出不穷,那么这些应用及平台都需要使用到数据库.如何高效的对数据进行日常维护.管理.监控成为迫切需要解决的问题. 基于web的方 ...