[ios]ios语音识别

参考：http://blog.sina.com.cn/s/blog_923fdd9b0101flx1.html

通过谷歌语音接口的实现语音识别

最近在项目中有需要实现语音识别的功能。折腾了几天才搞好。刚开始做的时候没点头绪，网上找的资料都是乱七八糟的，要不就是非常古老的实现方法，一些简单的代码片段。所以我决定把我的经验分享给大家。

要在IOS中实现语音识别流程如下:

录音->pcm格式->转换wav->转换flac->向谷歌发送请求->等待返回的json数据->解析数据;

首先如果你要使用谷歌的接口实现语音识别必须知道下面着几点：

1.如何发送POST请求。(可以使用开源库ASIHttpRequest，AFNetWorking，这些库都封装了网络请求，使用起来非常简单);

2.了解音频格式pcm,wav,flac，(着三个音频格式的关系是，因为谷歌接口只接受flac音频格式，其他格式无法识别,IOS中无法录制flac音频格式,也无法录制wav,只能录制pcm,所以要一步一步转换);

3.了解AVAudioRecorder类如何使用，怎么配置.

在IOS中录音就要使用AVAudioRecorder这个类,这个类的实例方法如下:

- (id)initWithURL:(NSURL *)url settings:(NSDictionary *)settings error:(NSError **)outError;
url:录音完成后声音存放的位置,

settings:设置录制声音的参数，只有一个关键的key跟大家讲下AVFormatIDKey，这个key决定你录制出来声音的格式,我们要录成
lpcm格式,未压缩的原音数据,以便我们转换,所以使用kAudioFormatLinearPCM值.其他key可以在帮助文档看,

NSMutableDictionary *recordSetting =
[[NSMutableDictionaryalloc]init];

[recordSetting setValue:[NSNumbernumberWithInt:kAudioFormatLinearPCM]forKey:AVFormatIDKey];

[recordSetting setValue:[NSNumbernumberWithFloat:16000.0]forKey:AVSampleRateKey];

[recordSetting setValue:[NSNumbernumberWithInt:1]forKey:AVNumberOfChannelsKey];

[recordSetting setValue:[NSNumbernumberWithInt:16]forKey:AVLinearPCMBitDepthKey];

[recordSetting setValue:[NSNumbernumberWithInt:AVAudioQualityHigh]forKey:AVEncoderAudioQualityKey];

[recordSetting setValue:@(NO)forKey:AVLinearPCMIsBigEndianKey];

设置完这个对象后就可以开始录音了.得到lpcm格式音频数据后就开始我们的第一次转换，转换成wav，什么是wav呢？点击,
知道wav是什么之后就可以开始转码了.转码是用C实现的，着部分代码在下面我打包的文件里面；

文件转换成WAV之后还需要将WAV的转换成FLAC才能上传到谷歌接口进行语音识别，幸好在在github上有人封装好了一个FLAC的开源库:https://github.com/jhurt/FLACiOS

下载这个源码后要去掉OGG的支持，不然编译不过。直接点击文件
-，编译后进入，Products目录拿到.a和framework，把这个两个文件一起加入你的工程。

声音处理完毕后就要往谷歌语音接口发请求了。我是使用ASI发的请求，大家可以用其他库来发，毕竟ASI有点太老了，我只是用习惯了而已。这里的filePath就是转换后FLAC文件的地址;

#define GOOGLE_AUDIO_URL
@"http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN"

NSURL *URL = [NSURL
URLWithString:GOOGLE_AUDIO_URL];

ASIFormDataRequest *request =
[ASIFormDataRequestrequestWithURL:URL];

[request addRequestHeader:@"Content-Type"value:@"audio/x-flac;
rate=16000"];

[request
appendPostDataFromFile:filePath];

[request
setRequestMethod:@"POST"];

request.completionBlock = ^{

NSLog(@"json:
%@",request.responseString);

NSData *data = request.responseData;

id
ret = nil;

ret =
[NSJSONSerializationJSONObjectWithData:data options:NSJSONReadingMutableContainerserror:nil];

NSLog(@"ret %@",ret);

results(ret);

};

request.failedBlock = ^{

UIAlertView *alert =
[[UIAlertViewalloc]initWithTitle:@"错误"message:@"网络请求错误" delegate:nilcancelButtonTitle:@"确定" otherButtonTitles:nil,nil];

[alert show];

NSLog(@"网络请求错误：%@",request.error);

};

[request startSynchronous];

-----------------------------------------------------------------------------------------------
以下是谷歌返回的JSON解析
--------------------------------------------------------------------------------------------

if(dic ==nil || [dic count] ==
0){

return;

}

NSArray *array = [dic
objectForKey:@"hypotheses"];

if ([arraycount] ) {

NSDictionary *dic_hypotheses
= [arrayobjectAtIndex:0];

NSString * sContent
= [NSStringstringWithFormat:@"%@",
[dic_hypothesesobjectForKey:@"utterance"]];

self.textField.text = sContent;

}

[ios]ios语音识别的更多相关文章

[IOS]IOS UI指南
[IOS]IOS UI指南众所周知,IOS的界面设计,越来越流行,可以说都形成了一个标准,搜集了一些资料,供自己以后学习使用! iOS Human Interface Guidelines (中文翻 ...
iOS 10 语音识别Speech Framework详解
最近做了一个项目,涉及到语音识别,使用的是iOS的speech Framework框架,在网上搜了很多资料,也看了很多博客,但介绍的不是很详细,正好项目做完,在这里给大家详解一下speech Fram ...
iOS中语音识别功能／语音转文字教程具体解释韩俊强的博客
原文地址:http://blog.csdn.net/qq_31810357/article/details/51111702 前言:近期研究了一下语音识别,从百度语音识别到讯飞语音识别:首先说一下个人 ...
iOS中语音识别功能／语音转文字教程详解韩俊强的博客
每日更新关注:http://weibo.com/hanjunqiang 新浪微博原文地址:http://blog.csdn.net/qq_31810357/article/details/5111 ...
IOS Google语音识别更新啦！！！
旧版本的API: —Google提供了一个在线语音识别的API接口,通过该API可以进行中文.英文等语言的识别. API地址:http://www.google.com/speech-api ...
[ios]ios tts的使用
参考:http://www.tekuba.net/program/327/ http://blog.sina.com.cn/s/blog_923fdd9b0101flx3.html iOS平台由于本身 ...
iOS - iOS 应用
1.Xcode 项目属性 Product Name 软件名称.产品名称.项目名称 Organization Name 公司名称.组织名称 Organization Identifier 公司的唯一标识 ...
iOS - iOS 适配
前言什么是适配: 适应.兼容各种不同的情况. iOS 开发中,适配的常见种类: 1)系统适配, 针对不同版本的操作系统进行适配. 2)屏幕适配,针对不同大小的屏幕尺寸进行适配. iPhone 的尺寸 ...
[ios]iOS 图形编程总结
转自:http://www.cocoachina.com/ios/20141104/10124.html iOS实现图形编程可以使用三种API(UIKIT.Core Graphics.OpenGL E ...

随机推荐

(转)mysql数据文件解析
一数据文件在 MySQL中每一个数据库都会在定义好(或者默认)的数据目录下存在一个以数据库名字命名的文件夹,用来存放该数据库中各种表数据文件.不同的 MySQL存储引擎有各自不同的数据文件,存放位 ...
node初识——node中的require方法与require.js的区别
出处:http://blog.csdn.net/u013613428/article/details/51966500 作为一个前端的新手,总是诧异于js的模块载入方式,看到了通过requireJs提 ...
php发送与接收流文件
PHP 发送与接收流文件 sendStreamFile.php 把文件以流的形式发送 receiveStreamFile.php 接收流文件并保存到本地 sendStreamFile.php < ...
Leetcode: Binary Tree Postorder Transversal
Given a binary tree, return the postorder traversal of its nodes' values. For example: Given binary ...
ajax response 系统错误时responseText出现一堆代码
在后期维护webform的一个项目时遇到个比较大的坑,前台ajax请求,失败时弹出后台自定义的错误信息responsetext.结果在本地运行时能正常弹出“验证码错误”,而发布到服务器上respons ...
fafu 1413
叉积的运用 ,不断的用叉积去判断最小的拼图, 刚开始对点进行排序,每个人的排序规则不同做法可能不同,我是按照点的x轴进行x轴相同用y小的在前面,然后每个点按照最下的点开始进行查找每次从一个点出发然 ...
CHM无法正常显示的问题
很喜欢看CHM电子书,感觉篇幅不是很长,而且可以索引:但是昨天遇到这个问题: 打开文件的时候发现: 很喜欢看CHM电子书,感觉篇幅不是很长,而且可以索引:但是昨天遇到这个问题: 打开文件的时候发现: ...
servlet+jsp+java实现Web应用
servlet+jsp+java实现Web应用环境: 1,eclipse 2,tomcat3,eclipse tomcat 插件开发过程: 1,建立一个Dynamic Web Project 2, ...
2018-2019-1 20189218《Linux内核原理与分析》第四周作业
构造简单的Linux内核显然用实验楼配好的环境做这个实验太简单了,按照没有困难制造困难也要上的原则,在自己的64位虚拟机上做这个实验. 按照课本(视频)上的步骤一直做下去,到编译生成init时出现了 ...
Java集合总结(List、Map、Set)
集合的引入当我们有种需求,需要存储多个元素的结构时,我们前面讲过数组,数组可以存储.但是数组也有它的弊端,使用的时候,必须先定义好长度,也就是数组的长度是固定,不能根据我们的需求自动变长或者变短. ...

[ios]ios语音识别

[ios]ios语音识别的更多相关文章

随机推荐

热门专题