使用SpeechRecognition进行语音识别

操作系统： CentOS7.7.1908_x64

gcc版本：4.8.5

Python 版本 : 3.6.8

安装语音识别环境：

virtualenv -p /usr/bin/python3 py36asr

source py36asr/bin/activate

pip install SpeechRecognition

yum install python3-devel

yum install pulseaudio-libs-devel

yum install alsa-lib-devel

pip install  PocketSphinx

配置中文语音识别数据：

下载地址：

https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/

选择： Mandarin->cmusphinx-zh-cn-5.2.tar.gz

配置数据：

cd py36asr/lib/python3.6/site-packages/speech_recognition/pocketsphinx-data/

tar zxvf cmusphinx-zh-cn-5.2.tar.gz

mv cmusphinx-zh-cn-5.2 zh-cn

cd zh-cn

mv zh_cn.cd_cont_5000 acoustic-model

mv zh_cn.lm.bin language-model.lm.bin

mv zh_cn.dic pronounciation-dictionary.dict

测试文本：

自然语言理解和生成是一个多方面问题，我们对它可能也只是部分理解。

语音识别示例：

(py36asr) [root@host60 pyasrTest1]# ls

test1.py  test1.wav

(py36asr) [root@host60 pyasrTest1]# cat test1.py

# -*- coding: utf-8 -*-

# /usr/bin/python

import speech_recognition as sr

r = sr.Recognizer()

test = sr.AudioFile("test1.wav")

with test as source:

    audio = r.record(source)

type(audio)

c=r.recognize_sphinx(audio, language='zh-cn')

print(c)

(py36asr) [root@host60 pyasrTest1]# python test1.py

自然 语言 李杰 和 申城 是一 个 多方 面 问题 我们 对 他 可能 也 只是 部分 礼节

(py36asr) [root@host60 pyasrTest1]#

本文涉及资源下载地址：https://pan.baidu.com/s/1Out0tJlb_Qs-2C06_2YHOQ

可关注微信公众号（聊聊博文）后回复 2020062101 获取提取码。

本文github地址：

https://github.com/mike-zhang/mikeBlogEssays/blob/master/2020/20200621_使用SpeechRecognition进行语音识别.rst

使用SpeechRecognition进行语音识别的更多相关文章

【iOS10 SpeechRecognition】语音识别现说现译的最佳实践
首先想强调一下“语音识别”四个字字面意义上的需求:用户说话然后马上把用户说的话转成文字显示!,这才是开发者真正需要的功能. 做需求之前其实是先谷歌百度一下看有没有造好的轮子直接用,结果真的很呵呵,都是 ...
【转】app之YdbOnline说明文档
概述 YdbOnline是面向网页开发者提供的网页开发工具包. 通过使用YdbOnline,网页开发者可借助YdbOnline高效地使用语音.位置等手机系统的能力,同时可以直接使用清除缓存.扫一扫等A ...
痞子衡嵌入式：语音处理工具Jays-PySPEECH诞生记（5）- 语音识别实现(SpeechRecognition, PocketSphinx0.1.15)
大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是语音处理工具Jays-PySPEECH诞生之语音识别实现. 语音识别是Jays-PySPEECH的核心功能,Jays-PySPEECH借 ...
WP中的语音识别（下）：语音指令
除了系统集成的可以用于搜索.启动应用程序等语音命令外,在我们的应用程序内部还能自己定义语音指令,使得我们的APP能与语音操控结合得更加完全. 语音指令是通过一个XML文件来定义的.比如,咱小舅子开了家 ...
WP中的语音识别（上）：基本识别
WP 8.1目前许多内容仍处于未确定状态,因此,本文所提及的语音识别,是基于WP8的,在8.1中也差不多,也是使用运行时API来实现,如果大家不知道什么是运行时API,也没关系,不影响学习和开发,因为 ...
与众不同 windows phone (45) - 8.0 语音: TTS, 语音识别, 语音命令
[源码下载] 与众不同 windows phone (45) - 8.0 语音: TTS, 语音识别, 语音命令作者:webabcd 介绍与众不同 windows phone 8.0 之语音 TT ...
HTML5 Web Speech API 结合Ext实现浏览器语音识别以及输入
简介 Web Speech API是HTML5技术中的一个提供原生语音识别技术的API,Google Chrome在25版之后开始支持Web Speech API,Google也提供了一个 ...
Windows 10 IoT Serials 5 - 如何为树莓派应用程序添加语音识别与交互功能
都说语音是人机交互的重要手段,虽然个人觉得在大庭广众之下,对着手机发号施令会显得有些尴尬.但是在资源受限的物联网应用场景下(无法外接鼠标键盘显示器),如果能够通过语音来控制设备,与设备进行交互,那还是 ...
微信小程序语音与讯飞语音识别接口（Java）
项目需求,需要使用讯飞的语音识别接口,将微信小程序上传的录音文件识别成文字返回而微信小程序上传的文件格式是silk的,而讯飞接口能识别wav 格式的文件,所以需要将小程序上传的silk文件转成wav ...
微信小程序语音与讯飞语音识别接口（Java），Kronopath/SILKCodec，ffmpeg处理silk，pcm，wav转换
项目需求,需要使用讯飞的语音识别接口,将微信小程序上传的录音文件识别成文字返回首先去讯飞开放平台中申请开通语音识别功能在这里面下载sdk,然后解压,注意appid与sdk是关联的,appid在初始 ...

随机推荐

[转帖]jmeter 响应时间rt很小，但是tps也很小&jmeter，脚本处理，千万不要用js
一.背景: 在压测的时候,查看jmeter聚合报告,发现rt很小,但是tps也很小. 讲道理来说,响应时间越小,tps应该越大. 一共压测10分钟,发现jmeter请求的样本数量非常小,才8500个请 ...
[转帖]数据库篇-MySql架构介绍
https://zhuanlan.zhihu.com/p/147161770 公众号-坚持原创,码字不易.加微信 : touzinv 关注分享,手有余香~ 本篇咱们也来聊聊mysql物理和逻辑架构,还 ...
【转帖】Java Full GC (Ergonomics) 的排查
文章目录 1. Full GC (Ergonomics) 1.1 Java 进程一直进行 Full GC 1.2 Full GC 的原因 1.3 检查堆占用 2. 代码检查 3. 解决方式 1. Fu ...
Python学习之七_input和print
Python学习之七_input和print 摘要 python3 之后函数必须带 () 了因为我开始学习的比较晚, 所以准备Python3开始学起前面主要是模仿别人的代码进行学习后续慢慢学习 ...
[转帖]Elasticsearch部署配置建议
1: 选择合理的硬件配置:尽可能使用 SSD Elasticsearch 最大的瓶颈往往是磁盘读写性能,尤其是随机读取性能.使用SSD(PCI-E接口SSD卡/SATA接口SSD盘)通常比机械硬盘(S ...
[转帖]Linux中的用户和用户组
https://www.jianshu.com/p/76700505cac4 1,Linux中的用户分类超级用户:拥有对系统的最高管理权限,默认是root用户. 普通用户:只能对自己目录下的文件进行 ...
[转帖]Nginx（2）：架构设计与工作流程
https://cloud.tencent.com/developer/article/1886166?areaSource=&traceId= 这些天呐,实在是给我看晕了.起因自然还是对 n ...
在K8S中各个组件及其作用？
Kubernetes(简称K8s)是一个强大的容器编排系统,其主要组件及其作用如下: kube-apiserver: 集群的主入口点,提供了RESTful API接口供用户或内部组件与集群进行交互.它 ...
electron-builder
electron-builder打包工具首先,确保你的项目中已经安装了 electron-builder.可以在项目根目录下运行以下命令来安装它: npm install electron-buil ...
GIT专业术语教程-转载
目录一.版本控制概要 1.1.什么是版本控制 1.2.常用术语 1.3.常见的版本控制器 1.4.版本控制分类 1.4.1.本地版本控制 1.4.2.集中版本控制 1.4.3.分布式版本控制 1.5 ...

使用SpeechRecognition进行语音识别

使用SpeechRecognition进行语音识别的更多相关文章

随机推荐

热门专题