在鸿蒙NEXT开发中实现一个语音识别组件

鸿蒙系统发布以后都不知道叫它5.0版本还是NEXT版本了，哈哈，反正是最新版本就对了。
对于语音转换文字，鸿蒙系统提供了离线语音识别模型speechRecognizer，语种目前支持中文，识别效果非常不错。

今天要分享的是使用speechRecognizer实现一个语音识别组件。
要实现语音识别，首先要配置麦克风使用权限：

ohos.permission.MICROPHONE

然后我们要检查应用是否获取到了麦克风权限，这一步操作很多时候都会用到，所以为大家封装一个通用方法：

import { abilityAccessCtrl, bundleManager, common, Permissions } from '@kit.AbilityKit';

export class PermissionManager {

  static checkPermission(permissions: Permissions[]): boolean {

    let atManager: abilityAccessCtrl.AtManager = abilityAccessCtrl.createAtManager();

    let tokenID: number = 0;

    const bundleInfo =

      bundleManager.getBundleInfoForSelfSync(bundleManager.BundleFlag.GET_BUNDLE_INFO_WITH_APPLICATION);

    tokenID = bundleInfo.appInfo.accessTokenId;

    if (permissions.length === 0) {

      return false;

    } else {

      return permissions.every(permission =>

      abilityAccessCtrl.GrantStatus.PERMISSION_GRANTED ===

      atManager.checkAccessTokenSync(tokenID, permission)

      );

    }

  }

  static async requestPermission(permissions: Permissions[]): Promise<boolean> {

    let atManager: abilityAccessCtrl.AtManager = abilityAccessCtrl.createAtManager();

    let context: Context = getContext() as common.UIAbilityContext;

    const result = await atManager.requestPermissionsFromUser(context, permissions);

    return !!result.authResults.length && result.authResults.every(authResults => authResults === 0);

  }

}

语音识别的使用分为创建引擎、设置回调、开始监听几个步骤，同样为大家封装一个实体类：

import { speechRecognizer } from '@kit.CoreSpeechKit';

class SpeechRecognizerManager {

  /**

   * 语种信息

   * 语音模式：长

   */

  private static extraParam: Record<string, Object> = { "locate": "CN", "recognizerMode": "long" };

  private static initParamsInfo: speechRecognizer.CreateEngineParams = {

    /**

     * 地区信息

     * */

    language: 'zh-CN',

    /**

     * 离线模式：1

     */

    online: 1,

    extraParams: this.extraParam

  };

  /**

   * 引擎

   */

  private static asrEngine: speechRecognizer.SpeechRecognitionEngine | null = null

  /**

   * 录音结果

   */

  static speechResult: speechRecognizer.SpeechRecognitionResult | null = null

  /**

   * 会话ID

   */

  private static sessionId: string = "as" + Date.now()

  /**

   * 创建引擎

   */

  private static async createEngine() {

    // 设置创建引擎参数

    SpeechRecognizerManager.asrEngine = await speechRecognizer.createEngine(SpeechRecognizerManager.initParamsInfo)

  }

  /**

   * 设置回调

   */

  private static setListener(callback: (srr: speechRecognizer.SpeechRecognitionResult) => void = () => {

  }) {

    // 创建回调对象

    let setListener: speechRecognizer.RecognitionListener = {

      // 开始识别成功回调

      onStart(sessionId: string, eventMessage: string) {

        console.log('onstart')

      },

      // 事件回调

      onEvent(sessionId: string, eventCode: number, eventMessage: string) {

      },

      // 识别结果回调，包括中间结果和最终结果

      onResult(sessionId: string, result: speechRecognizer.SpeechRecognitionResult) {

        SpeechRecognizerManager.speechResult = result

        callback && callback(result)

      },

      // 识别完成回调

      onComplete(sessionId: string, eventMessage: string) {

        console.log('complete')

      },

      // 错误回调，错误码通过本方法返回

      // 如：返回错误码1002200006，识别引擎正忙，引擎正在识别中

      // 更多错误码请参考错误码参考

      onError(sessionId: string, errorCode: number, errorMessage: string) {

        console.log('error')

      },

    }

    // 设置回调

    SpeechRecognizerManager.asrEngine?.setListener(setListener);

  }

  /**

   * 开始监听

   * */

  static startListening() {

    // 设置开始识别的相关参数

    let recognizerParams: speechRecognizer.StartParams = {

      // 会话id

      sessionId: SpeechRecognizerManager.sessionId,

      // 音频配置信息。

      audioInfo: {

        // 音频类型。当前仅支持“pcm”

        audioType: 'pcm',

        // 音频的采样率。当前仅支持16000采样率

        sampleRate: 16000,

        // 音频返回的通道数信息。当前仅支持通道1。

        soundChannel: 1,

        // 音频返回的采样位数。当前仅支持16位

        sampleBit: 16

      },

      //   录音识别

      extraParams: {

        // 0:实时录音识别  会自动打开麦克风 录制实时语音

        "recognitionMode": 0,

        //   最大支持音频时长

        maxAudioDuration: 60000

      }

    }

    // 调用开始识别方法

    SpeechRecognizerManager.asrEngine?.startListening(recognizerParams);

  };

  /**

   * 取消识别

   */

  static cancel() {

    SpeechRecognizerManager.asrEngine?.cancel(SpeechRecognizerManager.sessionId)

  }

  /**

   * 释放ai语音转文字引擎

   */

  static shutDown() {

    SpeechRecognizerManager.asrEngine?.shutdown()

  }

  /**

   * 停止并且释放资源

   */

  static async release() {

    SpeechRecognizerManager.cancel()

    SpeechRecognizerManager.shutDown()

  }

  /**

   * 初始化ai语音转文字引擎

   */

  static async init(callback: (srr: speechRecognizer.SpeechRecognitionResult) => void = () => {

  }) {

    try {

      await SpeechRecognizerManager.createEngine()

    } catch (err) {

      console.log('err',JSON.stringify(err))

    }

    SpeechRecognizerManager.setListener(callback)

    SpeechRecognizerManager.startListening()

  }

}

export default SpeechRecognizerManager

最后在需要使用的地方调用上面封装的方法就可以了：

const permissions: Permissions[] = ["ohos.permission.MICROPHONE"]

    // 检查是否拥有权限

    const isPermission = await PermissionManager.checkPermission(permissions)

    if (!isPermission) {

      //   如果没权限，就主动申请

      PermissionManager.requestPermission(permissions)

    }else {

      SpeechRecognizerManager.init(res => {

        console.log("实时语音识别", JSON.stringify(res))

        this.text = res.result

      })

    }

在鸿蒙NEXT开发中实现一个语音识别组件的更多相关文章

在C#/.NET应用程序开发中创建一个基于Topshelf的应用程序守护进程(服务)
本文首发于:码友网--一个专注.NET/.NET Core开发的编程爱好者社区. 文章目录 C#/.NET基于Topshelf创建Windows服务的系列文章目录: C#/.NET基于Topshelf ...
iPhone开发中从一个视图跳到另一个视图有三种方法：
iPhone开发中从一个视图跳到另一个视图有三种方法: 1.self.view addSubView:view .self.window addSubView,需要注意的是,这个方法只是把页面加在 ...
MVC已经是现代Web开发中的一个很重要的部分，下面介绍一下Spring MVC的一些使用心得。
MVC已经是现代Web开发中的一个很重要的部分,下面介绍一下Spring MVC的一些使用心得. 之前的项目比较简单,多是用JSP .Servlet + JDBC 直接搞定,在项目中尝试用 Strut ...
在开发中进入一个方法后想要到原来那行 ctrl+alt+左回到上一步 ctrl+alt+右回到下一步
在开发中进入一个方法后想要到原来那行 ctrl+alt+左回到上一步ctrl+alt+右回到下一步
.net开发中常用的第三方组件
.net开发中常用的第三方组件 2013-05-09 09:33:32| 分类: dotnet |举报 |字号订阅下载LOFTER 我的照片书 | RSS.NET.dll RSS. ...
项目开发中封装一个BarButtonItem类别-很实用
Encapsulates a TabBarItem--封装一个BarButtonItem类在我们程序的导航栏的左边或右边一般都会有这样的BarButtonItem,用来界面之间的跳转如果我们有很多 ...
Dynamics CRM - 在 Dynamics CRM 开发中创建一个 Entity 对象
在 Dynamics CRM 的开发中,我们时不时需要创建 Entity 对象,而对于如何创建 Entity 对象,在 C# plugin 和 JS 的写法存在些许差异. 一.C# Plugin 创建 ...
从微信小程序到鸿蒙js开发【04】——list组件
目录: 1.可滚动区域 2.list + list-item 3.list + list-item-group + list-item 1.可滚动区域在许多场景中,页面会有一块区域是可滚动的,比如这 ...
NDK开发中的一个HTTP下载实例附带下载进度
有一个控制下载的管理类吧,调用http下载类进行各种下载,同时在下载过程中可以显示其下载的进度,而且在每个下载结束之后以类似回调的方式告诉管理类,以继续进行后续的操作. 直接代码: .h文件 #pra ...
从微信小程序到鸿蒙js开发【05】——tabs组件&每日新闻
目录: 1.tabs, tab-bar, tab-content 2.tabs的事件处理 3.tabs实现的每日新闻 1.tabs, tab-bar, tab-content 上章说到,鸿蒙的list ...

随机推荐

在Windows系统中安装Open WebUI并连接Ollama
一.Open WebUI简介与安装前准备 Open WebUI是一个开源的大语言模型(LLM)交互界面,支持本地部署与离线运行.通过它,用户可以在类似ChatGPT的网页界面中,直接操作本地运行的Ol ...
linux命令行连接wifi
linux命令行连接wifi 1.安装nmcli sudo apt-get install nmcli 2.查看网络设备 sudo nmcli dev 3.开启wifi sudo nmcli r wi ...
MOS管耗散功率的计算
MOS管的功率,一般是指Maximum Power Dissipation--Pd,最大的耗散功率,具体是指MOS元件的容许损失,可从产品的热阻上求得.当Tc=25度时,通过附加最大容许损耗Pd,则变 ...
php-fpm自动重启解决方案
环境:Mac.php7.1.nginx 现象:killall php-fpm,php-fpm自动重启共有如下几种解决方案: 1.检查php-fpm.conf的deamonize模式是否开启 2.查找 ...
go kratos protobuf 接收动态JSON数据
前言 google.protobuf.Struct 是 Google Protocol Buffers 中的一种特殊类型,用于表示动态的键值对数据.它可以存储任意类型的数据,并提供了方便的方法来访问和 ...
websocket: the client is not using the websocket protocol: ‘upgrade’ token not found in ‘Connection’ head，客户端没有使用websocket协议:'upgrade'令牌未在'Connection'头中找到
错误分析 websocket: the client is not using the websocket protocol: 'upgrade' token not found in 'Connec ...
【消息利器RabbitMQ】RabbitMQ常用内容浅析
以下是一篇关于 RabbitMQ 的博客内容,涵盖了从基础到死信队列的实现,以及 RabbitMQ 其他常用知识点的补充.内容逻辑清晰,代码完整,适合直接发布. 使用 RabbitMQ 实现消息队列与 ...
从Docker Machine到K8S：容器管理为啥有这么多工具？
2018-11-09 18:01 关注嘉为科技,获取运维新知目录 1.有了Docker,为啥还需要额外容器管理工具 2.Docker三剑客 Docker Machine Docker Compo ...
防止恶意解析——禁止通过IP直接访问网站
一.什么是恶意解析一般情况下,要使域名能访问到网站需要两步,第一步,将域名解析到网站所在的主机,第二步,在web服务器中将域名与相应的网站绑定.但是,如果通过主机IP能直接访问某网站,那么把域名解析 ...
CSAPP学习笔记——Chapter12 并行编程
CSAPP学习笔记--Chapter12 并行编程并发编程有着其独特的魅力,之前接触cuda编程的时候,感受到一些,没想到书里还有相关的内容.今天我们主要围绕进程,I/O多路复用,线程三种并发的方式 ...

在鸿蒙NEXT开发中实现一个语音识别组件

在鸿蒙NEXT开发中实现一个语音识别组件的更多相关文章

随机推荐

热门专题