用Python来使用科大讯飞语音识别,so easy
在人工智能高速发展的今天,语音识别技术被带入到人们的工作和生活中,开始被越来越多的人关注和使用,今天,当各种在线客服被机器人客服代替,当速记翻译馆被语音识别代替,甚至当收银员、驾驶员、工厂工人、普通文书和律师都被人工智能代替时,人们也越来越焦虑。下面这篇文章分享Python用ctypes调用动态库的方式使用科大讯飞语音识别。

ctypes 是 Python 的一个模块,它提供了C语言相关的数据类型,可以方便的调用C语言编写的DLL(Windows 动态链接库)和so(Linux动态链接库)。科大讯飞的语音识别客户端SDK提供了Linux下的C语言SDK,却没有Python的。有了ctypes,我们就可以很轻松的用Python来使用科大讯飞的语音识别了。

通过LoadLibrary()函数加载动态库:
xflib = ctypes.cdll.LoadLibrary('msc/libmsc.so')
在Python里面调用C函数时主要是注意参数的类型。语音识别的接口的具体参数可以参考其提供的文档,比如接口函数:
const char* MSPAPI QISRSessionBegin( const char* grammarList, const char*
params, int* errorCode )
返回的是一个char指针作为sessionID以供后续接口作为参数使用,在Python里面要用ctypes.c_voidp类型:
ret = ctypes.c_int()
sessionId = ctypes.c_voidp()
sessionId = xflib.QISRSessionBegin(None, param1, ret)
调用其它接口函数时,还可能用到如下ctypes的类型和接口:
- ctypes.create_string_buffer()
- ctypes.addressof()
- ctypes.byref()
- ctypes.string_at()
- ctypes.c_char_p()
- ctypes.c_uint()
关于ctypes的更详细说明可以参考官方文档。
文章整理于www.yuanrenxue.com
用Python来使用科大讯飞语音识别,so easy的更多相关文章
- 安卓Android科大讯飞语音识别代码使用详解
		科大讯飞的语音识别功能用在安卓代码中,我把语音识别写成了Service,然后在Fragment直接调用service服务.科大讯飞语音识别用的是带对话框的那个,直接调用科大讯飞的语音接口,代码采用链表 ... 
- 百度语音识别vs科大讯飞语音识别
		一.结果 从笔者试验的结果来看,科大讯飞的语音识别技术远超百度语音识别 二.横向对比 科大讯飞语音识别 百度语音识别 费用 各功能的前5小时免费 全程免费 转换精准率 非常高 比较低 linux ... 
- android128   zhihuibeijing   科大讯飞 语音识别
		- 科大讯飞 开放平台 http://open.voicecloud.cn/ package com.itheima.voicedemo; import android.app.Activity; i ... 
- cordova科大讯飞语音识别
		cordova-plugin-IFlyspeech 科大讯飞的语音听说读写的cordova插件 Supported Platforms iOS android Installation 插件安装命令: ... 
- Python使用websocket调用语音识别,语音转文字
		@ 目录 0. 太长不看系列,直接使用 1. Python调用标贝科技语音识别websocket接口,实现语音转文字 1.1 环境准备: 1.2 获取权限 1.2.1 登录 1.2.2 创建新应用 1 ... 
- ros科大讯飞语音识别
		转自http://www.ncnynl.com/archives/201611/1069.html ROS入门教程-编写科大讯飞语音SDK的ROS包 说明 ROS软件包xfei_asr是集成自科大讯飞 ... 
- ros语音交互(四)移植科大讯飞语音识别到ros
		将以前下载的的语音包的 samples/iat_record/的iat_record.c speech_recognizer.c speech_recognizer.c 拷贝到工程src中, linu ... 
- ros科大讯飞语音识别环境配置
		以在线命令词识别为例: 链接:http://www.xfyun.cn/sdk/dispatcher 1.下载SDK,解压: 2.在ROS工作空间下创建一个Package: catkin_create_ ... 
- python 上传百度语音识别+文字返回结果
		1文字生成语音 #!/usr/bin/python3 import urllib.request import requests#导入requests库 import urllib import js ... 
随机推荐
- Git操作记录、腾讯工蜂
			腾讯工蜂: http://git.code.tencent.com 登录-->>创建项目-->>获取仓库路径 https://git.code.tencent.com/dang ... 
- QtCreator中打开.ui文件时卡死崩溃的解决方法
			问题 QtCreator中打开一个项目,在编辑器中打开普通的.cpp或.h等文件正常,构建正常,运行正常,但是打开ui文件(QtCreator自动调用designer)时会卡死然后崩溃退出. 解决方法 ... 
- python argparse库
			argparse用法总结 https://blog.csdn.net/qq_24551305/article/details/90155858 args = parse.parse_args()par ... 
- 前端入门系列之CSS
			CSS (Cascading Style Sheets) 是用来样式化和排版你的网页的 —— 例如更改网页内容的字体.颜色.大小和间距,将内容分割成多列或者加入动画以及别的装饰型效果. CSS是什么 ... 
- JavaScript、TypeScript、ES6三者之间的联系和区别
			ES6是什么 ECMAScript 6.0(以下简称ES6)是JavaScript语言(现在是遵循ES5标准)的下一代标准,已经在2015年6月正式发布了.它的目标,是使得JavaScript语言可以 ... 
- Dining(POJ-3281)【最大流】
			题目链接:https://vjudge.net/problem/POJ-3281 题意:厨师做了F种菜各一份,D种饮料各一份,另有N头奶牛,每只奶牛只吃特定的菜和饮料,问该厨师最多能满足多少头奶牛? ... 
- Centos安装 k8s
			### 一. 安装docker 1.安装依赖包```shellsudo yum install -y yum-utils device-mapper-persistent-data lvm2 ``` ... 
- asp.net core-1.在控制台创建ASP.NET Core应用程序
			创建asp.net core应用程序,需要先把环境安装好,我这边选的是vs2017 第一步先执行dotnet 我执行dotnet --help可以把所有的命令全部列出来: 红框内就是我们可以用来初始化 ... 
- Golang语言编程规范
			Golang语言编程规范 一.说明 编程规范好,可避免语言陷阱,可有利团队协作,有利项目维护. 正常的Go编程规范有两种:编译器强制的(必须的),gofmt格式化非强制的(非必须). Go宣告支持驼峰 ... 
- Asp.net core中间件实现原理及用法解说
			简述asp.net core中间件的实现思路 原文地址:https://www.cnblogs.com/shengyu-kmust/p/11583974.html 一次http请求的过程,就是对一个R ... 
