云小课 | 一个三分钟快速定制OCR应用的神器,要不?
摘要:ModelArts Pro提供了文字识别套件,基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务。三分钟即可快速定制OCR服务,实现多种版式图像的文字信息结构化提取。
本文分享自华为云社区《【云小课】EI第15课 ModelArts Pro 文字识别套件,三分钟快速定制OCR服务》,原文作者: Hi,EI 。

ModelArts Pro 是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。
ModelArts Pro提供了文字识别套件,基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务。三分钟即可快速定制OCR服务,实现多种版式图像的文字信息结构化提取。
接下来就是见证奇迹的时刻~
预置工作流
文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
- 通用单模板工作流
通过构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。
- 多模板分类工作流
支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。通常适用于物流行业。
特色优势
- 领先的AI开发平台
底层依托ModelArts提供的领先的算法技术,保证AI应用开发的高效和推理结果的准确,同时减少人力投入。
- 简单的流程式开发
无需人工智能专业知识,用户可借助预置的行业工作流,全流程可视化完成完成AI应用开发以及持续迭代。
- 高效的行业算法
领先人工智能技术结合行业专家经验,构建出优质高效的行业预置算法,行业AI应用开发者仅需少量标注数据,就能获得高精度的AI应用。
- 支持复杂场景
旋转、褶皱等不利的图片质量下,能做到高精度的有效识别。
5步上手文字识别套件
第一步:开通套件
目前ModelArts Pro 文字识别套件处于公测阶段,首次使用文字识别套件需要开通公测权限。
登录ModelArts Pro控制台,选择行业套件卡片并单击“申请公测”,在申请公测页面根据界面提示填写所需信息。

申请公测操作完成后,单击“前往我的公测”,进入“我的公测”页面。当“审批状态”显示为“审批通过”时,表示您已经获得了该行业套件的公测权限。
第二步:委托授权
在您使用ModelArts Pro过程中,ModelArts Pro需要进行委托授权,用于访问ModelArts服务的云资源。如果没有授权,相关功能将不能正常使用。
如果未获得ModelArts委托授权和访问秘钥(AK/SK)授权,当进入ModelArts Pro控制台的行业套件时,会弹出“访问授权”对话框。
在弹出的“访问授权”对话框填写授权信息,然后单击“同意授权”,完成访问授权的配置。
- “用户名”为当前需要授权的用户名,保持默认值。
- “委托”选择“modelarts_agency”。
- 勾选“我已经详细阅读并同意《ModelArts服务声明》”。

详情请见配置访问权限。
第三步:创建应用
根据您的行业和应用场景,选择匹配的工作流,创建您的应用。
1、在ModelArts Pro控制台界面,单击“文字识别”套件卡片的“进入套件”。
进入文字识别套件控制台。

2、在左侧导航栏选择“应用开发>工作台”。
默认进入“我的应用”页签。
3、在“我的应用”页签下,单击“新建应用”。
进入“新建应用”页面。
您也可以单击“我的工作流”,切换至“我的工作流”页签,选择工作流并单击卡片中的“新建应用”。

4、根据业务需求填写“应用名称”、“应用负责人”和“应用描述”,选择“所属行业”及工作流。

5、确认信息后,单击“确定”。
成功新建应用。
第四步:开发并上线应用
根据流程指引完成工作流,并将应用发布上线。
通用单模板工作流:

多模板分类工作流:

第五步:迭代优化
维护应用,不断优化迭代。
物流+ModelArts Pro 文字识别套件
物流企业源自全球各地的单据板式数以万计,物流参与各方需要耗费人力执行大量的纸质单证信息的手工录入等操作。
传统方式开发文字识别需要7天,使用ModelArts Pro 文字识别套件的预置工作流完成新版式票证结构提取接口开发仅需3分钟。
那么,实践一下,教您五步上手文字识别套件~
详情请戳这里了解。
云小课 | 一个三分钟快速定制OCR应用的神器,要不?的更多相关文章
- 三分钟快速上手TensorFlow 2.0 (下)——模型的部署 、大规模训练、加速
前文:三分钟快速上手TensorFlow 2.0 (中)——常用模块和模型的部署 TensorFlow 模型导出 使用 SavedModel 完整导出模型 不仅包含参数的权值,还包含计算的流程(即计算 ...
- 云小课|MRS基础原理之MapReduce介绍
阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说).深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云.更多精彩内容请单击此处. 摘要:MapReduce ...
- 三分钟快速上手TensorFlow 2.0 (中)——常用模块和模型的部署
本文学习笔记参照来源:https://tf.wiki/zh/basic/basic.html 前文:三分钟快速上手TensorFlow 2.0 (上)——前置基础.模型建立与可视化 tf.train. ...
- 三分钟快速上手TensorFlow 2.0 (上)——前置基础、模型建立与可视化
本文学习笔记参照来源:https://tf.wiki/zh/basic/basic.html 学习笔记类似提纲,具体细节参照上文链接 一些前置的基础 随机数 tf.random uniform(sha ...
- 云小课|DGC数据开发之基础入门篇
阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说).深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云.更多精彩内容请单击此处. 摘要:欢迎来到DGC数据 ...
- 云小课|云小课教您如何选择Redis实例类型
阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说).深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云.更多精彩内容请单击此处. 摘要:购买Redis实例 ...
- 云小课|MRS数据分析-通过Spark Streaming作业消费Kafka数据
阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说).深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云.更多精彩内容请单击此处. 摘要:Spark Str ...
- 云小课|带你揭开IP地址的神秘身份
摘要:本文带你了解网络云产品和相关的知识内容. 华为云网络服务大家族提供了丰富的云产品,可以满足用户的各种网络互联需求.相应地,华为云帮助中心也贴心的奉上了你想了解的所有网络云产品知识. 可是小课最近 ...
- 云小课 | IPv4枯了,IPv6来了
摘要:本篇主要分享IPv4与IPv6的区别和IPv6的应用场景,助您快速理解华为云IPv6双栈及IPv6 EIP. IPv6的由来 上节课我们讲了公网IP与私网IP,了解了IP地址的一些知识. 我们一 ...
- 云小课 | 搬迁本地数据至OBS,多种方式任你选
摘要:搬迁本地数据至OBS,包括OBS工具方式.CDM方式.DES磁盘方式.DES Teleport方式和云专线方式,每种方式特点不同,本节课我们就一起看看有什么区别. 已有的业务数据可能保存在本地的 ...
随机推荐
- 一元多项式求和(c++源码)
LinkList.h #ifndef LINKLIST_H_ #define LINKLIST_H_ #include<stdio.h> template<class T> s ...
- 把工单历史表中的数据,按照工单进行分类,每一批工单的数据放在同一个 key 中
/** * 把工单历史表中的数据,按照工单进行分类,每一批工单的数据放在同一个key中 * 将对象列表按名称分类成 Map(分类名必与对象的某 get 方法的后的名一致<如:get(name) ...
- 深度解析NLP文本摘要技术:定义、应用与PyTorch实战
在本文中,我们深入探讨了自然语言处理中的文本摘要技术,从其定义.发展历程,到其主要任务和各种类型的技术方法.文章详细解析了抽取式.生成式摘要,并为每种方法提供了PyTorch实现代码.最后,文章总结了 ...
- 「保姆级」网络爬虫教程(二):教你下载文库中的PDF文档!
如何点赞再看,养成习惯.微信公众号搜索「Job Yan」关注这个爱发技术干货的 Coder.本文 GitHub https://github.com/JobYan/PythonPearls 已收录,还 ...
- 小米二面:Redis 如何保证数据不丢失?
前段时间表妹收到了小米秋招补录的面试邀请,一面还算顺利,很快就通过了,但在看二面面试录屏的时候,我发现了一个问题,回答的不是很好,也就是我们今天要聊的这个问题:Redis 如何保证数据不丢失? 很多人 ...
- css零散笔记——修改input样式input:-internal-autofill-selected背景色
闲聊: 小颖项目中的登录页需将 input 背景色设为透明,小颖将 input 的背景色设置后,发现表单自动填充后还是会有背景色,然后发现 浏览器 自带了背景色: 效果图: ...
- 解密Prompt系列20. LLM Agent之再谈RAG的召回多样性优化
几个月前我们就聊过RAG的经典方案解密Prompt系列14. LLM Agent之搜索应用设计.前几天刚看完openAI在DevDay闭门会议上介绍的RAG相关的经验,有些新的感悟,借此机会再梳理下R ...
- 使用mumu模拟器抓包 andriod app
背景 公司H5嵌入到农行手机app里面.某天有人反馈进入国内机票订单详情时,应用崩溃了,如下图: 经过测试,此问题仅在安卓手机中出现,且其他页面都正常.于是我怀疑可能是这个页面代码有问题,想着能否抓包 ...
- 1.5万字 + 25张图盘点RocketMQ 11种消息类型,你知道几种?
大家好,我是三友~~ 故事的开头是这样的 最近有个兄弟私信了我一张截图 我一看截图内容,好家伙,原来是我一年多前立的flag 倒不是我忘了这件事,我后来也的确写了一篇的关于RocketMQ运行的原理的 ...
- 怎么在Android项目中导入ffmpeg库?
1.前言 在这里我以导入静态库(.a)为例进行分析,动态库(.so)是类似的.在导入前,各位要先编译好ffmpeg库,需要注意的是在编译的时候要开启交叉编译,目标平台为Android,其他平台的库(w ...