从图像到信息，AI识图开启智能识别新时代

当前用户在使用各类应用时，文字、图片和视频已经成为互联网内容的主要载体，许多用户在浏览过程中通常想要选取页面上的文字或者得到图片或者视频画面的具体信息。比如，识别文本中的特定实体（如电话号码、邮箱、网址、地址、时间等），并进行快捷操作，例如直接拨打电话、打开网址、创建日程等；或者对图片中的物品或场景进行抠图，然后进行识图搜索，找到相似或相关的信息。

HarmonyOS SDK场景化视觉服务（Vision Kit）提供AI识图功能，通过聚合OCR（Optical Character Recognition）、主体分割、实体识别、多目标识别等AI能力，提供场景化的文本识别、主体分割、识图搜索功能。AI识图功能主开关入口在基础控件API列表中，如果您接受AI识图默认的交互和功能，仅需使用基础控件提供的相关使能接口打开功能开关即可。

识图功能提供如下能力：

•识别文字

用户长按文本选取文字或持续长按文本中的电话号码、邮箱、网址、地址、时间等实体，可触发对应实体的快捷操作，如持续长按文本中的时间，可触发"新建日程"快捷操作入口。

•识图搜索

用户抠图后可基于抠出的主体进行识图搜索，开发者也可以主动触发目标标识，触发后会识别图中的动物、植物、建筑物等目标并用相应的ICON标识，用户点击ICON也可以进行识图搜索，搜索结果会以模态窗的方式为用户呈现。

•主体分割

用户长按主体分割，分割后用户可以完成复制，分享，全选，识图搜索等功能。

•AIButton

AIButton承载了电话号码、邮箱、网址、地址、时间等实体的显性下划线标识（点击后出现快捷操作菜单），原图翻译（系统设置语种与图片上文本语种不一致且能将图中文本翻译为系统当前设置的语种时出现），表格提取（图片中存在表格时出现）等功能特性。配置AIButton属性可见后，会对图片进行预分析，当图片中存在文本且文本区域大于图片区域的5%时AIButton才会显示。

开发步骤

1.将AI识图控件相关的类添加。

import { visionImageAnalyzer } from '@kit.VisionKit';

import { BusinessError } from '@kit.BasicServicesKit';

2.初始化VisionImageAnalyzerController对象。

private visionImageAnalyzerController: visionImageAnalyzer.VisionImageAnalyzerController = new visionImageAnalyzer.VisionImageAnalyzerController();

3.设置界面属性AIButton可见，订阅事件。

aboutToAppear(): void {

  this.visionImageAnalyzerController?.setAIButtonVisibility(true);

  this.visionImageAnalyzerController.on('aiButtonStatusChange', (aiButtonState: visionImageAnalyzer.AIButtonStatus) => {

    console.info("DEMO_TAG", `aiButtonStatusChange result: ${JSON.stringify(aiButtonState)}`)

  })

  this.visionImageAnalyzerController.on('imageAnalyzerVisibilityChange', (visibility: visionImageAnalyzer.ImageAnalyzerVisibility) => {

    console.info("DEMO_TAG", `imageAnalyzerVisibilityChange result: ${JSON.stringify(visibility)}`)

  })

  this.visionImageAnalyzerController.on('textAnalysis', (text: string) => {

    console.info("DEMO_TAG", `textAnalysis result: ${JSON.stringify(text)}`)

  })

  this.visionImageAnalyzerController.on('selectedTextChange', (selectedText: string) => {

    console.info("DEMO_TAG", `selectedTextChange result: ${JSON.stringify(selectedText)}`)

  })

  this.visionImageAnalyzerController.on('subjectAnalysis', (subjects: visionImageAnalyzer.Subject[]) => {

    console.info("DEMO_TAG", `subjectAnalysis result: ${JSON.stringify(subjects)}`)

  })

  this.visionImageAnalyzerController.on('selectedSubjectsChange', (subjects: visionImageAnalyzer.Subject[]) => {

    console.info("DEMO_TAG", `selectedSubjectsChange result: ${JSON.stringify(subjects)}`)

  })

  this.visionImageAnalyzerController.on('analyzerFailed', (error: BusinessError) => {

    console.error("DEMO_TAG", `analyzerFailed result: ${JSON.stringify(error)}`)

  })

}

4.绑定VisionImageAnalyzerController对象，可以控制识图相关的交互。

build() {

  Stack() {

    // 需要替换您自己的资源图片，存放在resources/base/media目录下

    Image($r('app.media.img'), {

        types: [ImageAnalyzerType.TEXT, ImageAnalyzerType.SUBJECT, ImageAnalyzerType.OBJECT_LOOKUP],

        aiController: this.visionImageAnalyzerController

      })

      .width('100%')

      .height('100%')

      .enableAnalyzer(true)

      .objectFit(ImageFit.Contain)

  }.width('100%').height('100%')

}

5.取消订阅事件。

aboutToDisappear(): void {

  this.visionImageAnalyzerController.off('aiButtonStatusChange')

  this.visionImageAnalyzerController.off('imageAnalyzerVisibilityChange')

  this.visionImageAnalyzerController.off('textAnalysis')

  this.visionImageAnalyzerController.off('selectedTextChange')

  this.visionImageAnalyzerController.off('subjectAnalysis')

  this.visionImageAnalyzerController.off('selectedSubjectsChange')

  this.visionImageAnalyzerController.off('analyzerFailed')

}

了解更多详情>>

访问场景化视觉服务联盟官网

获取AI识图开发指导文档

从图像到信息，AI识图开启智能识别新时代的更多相关文章

全景智慧城市——VR全景，开启VR营销新时代
全景是一种新兴的富媒体技术. 与视频.声音.图片等传统主流媒体最大的区别是"可操作,可交互". 全景给人以三维立体感觉的实景360°全方位图像,此图像最大的三个特点: 全方位:展示 ...
通过AI识图判断图片是否为小票
先在百度智能云中创建一个应用加入以下标记功能(没有智能云账号可以去创建一个,创建应用也都是些基本操作) 本次只用到标记的功能. 此功能在图像识别下面. 创建应用后,页面会出现平台分配的密钥:API K ...
如何快速将百度大脑AI技术内置智能小程序中
实现效果: 该AI智能小程序目前集成了百度AI开放平台数十个AI服务产品功能,包括人脸识别.文字识别.表格识别.红酒识别.货币识别.地标识别.手势识别.商标识别.果蔬识别.菜品识别等图片识别功能,以及 ...
前端AI切图技巧
AI的基本使用 1.选中多个不同图层. 首先在AI右边工具栏找到“图层” 然后选择需要切图的图层(按住“ctrl”点击) 最后拖到PS里面的新建的图层. 还有个问题,就是图层关联太多,无法拖动某些图层 ...
安卓开发利用百度识图api进行物体识别（java版）
之前的随笔中,已经实现了python版本调用api接口,之所以使用python是因为python比java要简洁. 但是我发现在使用过程中,chaquopy插件会弹出底部toast显示"un ...
安卓开发利用百度识图api进行物体识别
前文之前的随笔中,已经通过相机或相册获取到了我们想要的图片,接下来进行识图api的配置工作.我使用的是百度的api,利用python获取信息,并在MainActivity中进行调用来输出信息. 一. ...
OpenResy+Lua 利用百度识图将图片地址解析成文字
LUA代码:(注:LUA里有一个调用百度识图的接口IP:123.125.115.189(stu.baidu.com),不知为什么我的虚拟机无法解析stu.baidu.com,所以我只能PING出IP来 ...
用VS2015打开cshtml识图文件的时候会报错如指定的文件不存在
用vs2015打开cshtml识图文件的时候会报错.百度后得到解决方法如下: 先关闭VS2015, 拷贝:%LocalAppData%\Microsoft\VisualStudio\14.0\Comp ...
python3 自动识图
一.安装依赖库 pip install pytesseract pip install pillow 二.安装识图引擎tesseract-ocr https://pan.baidu.com/s/1Qa ...
弱电系统标准CAD图例识图讲解
弱电系统标准CAD图例识图讲解 http://www.360doc.com/content/17/0317/16/33642774_637680009.shtml

随机推荐

成为Java GC专家系列(3) — 如何优化Java垃圾回收机制
本文是成为Java GC专家系列文章的第三篇.在第一篇<成为JavaGC专家Part I - 深入浅出Java垃圾回收机制>中我们学习了不同GC算法的执行过程,GC是如何工作的,什么是新生 ...
Git之清除历史记录操作
近期公司需要将之前代码仓库中的提交记录都清理,所以操作一下,记录一下步骤: 安全考虑: 有时候在提交代码时,不小心提交了敏感数据,如账号密码什么的,这样在历史记录中就可以查看到,这样很不安全,所以就需 ...
Mybatis【5】-- Mybatis多种增删改查那些你会了么？
前面我们学会了Mybatis如何配置数据库以及创建SqlSession,那怎么写呢?crud怎么写? 代码直接放在Github仓库[https://github.com/Damaer/Mybatis- ...
HashMap 源码解毒
PUT 方法解毒: hashcode 高低16进行异或运算,尽量降低哈希冲突的概率如果数组很小,hashcode的高位就不能被很好利用. final V putVal(int hash, K key ...
sql注入-数据库表基本操作
一.数据库 linux下登录: mysql -u root -p 查看数据库: show databases; 可以在phpmyadmin面板点击SQL进行操作 1. 增加/创建创建xxx数据库,并 ...
InheritableThreadLocal 父子线程值传递
最近项目中使用 @Async 异步远程调用的时候,发现主线程能拿到 token 值,子线程调用的时候 token 为 null.研究了一番,发现可以直接使用 InheritableThreadLoca ...
Fiddler抓包iOS手机配置全流程
前情平时做移动移动端开必的时候经常需要抓包手机,用于接口请求跟踪,但iOS的抓包经常性的配不成功,经过踩过不少坑后终于知道了整个配置流程,此文记录Fiddler抓包iOS手机的配置流程. Step ...
Python Tkinter 弹窗美化指南
在Python编程中,Tkinter是标准GUI(图形用户界面)库,它允许开发者创建桌面应用程序.尽管Tkinter提供了基本的窗口和控件功能,但默认的样式和外观往往显得单调.因此,对Tkinter弹 ...
中电金信：GienTech动态|一波好消息→中标！多领域“开花”
mysql5.7配置文件详解
8核心32G独立mysql服务器的配置文件如下: [client] port = 3306 socket = /data/mysql/mysql.sock [mysql] prompt = " ...

从图像到信息，AI识图开启智能识别新时代

开发步骤

从图像到信息，AI识图开启智能识别新时代的更多相关文章

随机推荐

热门专题