使用olami sdk实现一个语音查询股票的iOS程序
前言
在目前的软件应用中,输入方式还是以文字输入方式为主,但是语音输入的方式目前应用的越来越广泛。在这里介绍一个使用 Olami SDK 编写的一个使用语音输入查询股票的APP
Olami SDK的介绍在下面这个网址
https://cn.olami.ai/wiki/?mp=sdk&content=sdk/ios/reference.html
在这个网址中详细的介绍了Olami SDK包含了那些函数和定义的委托。
APP介绍
下面通过一个APP来介绍一下如何使用Olami SDK
这个APP的下载地址是
https://github.com/lym-ay/OlamiStock
1. 去上面的网址下载Olami SDK.包括两个文件,其中的一个是Olami的静态函数库,一个是其头文件
第一步是初始化Olami的语音识别对象,并设置代理
olamiRecognizer= [[OlamiRecognizer alloc] init];
olamiRecognizer.delegate = self;
2 . 调用setAuthorization函数进行授权
[olamiRecognizer setAuthorization:@"d13bbcbef2a4460dbf19ced850eb5d83"
api:@"asr" appSecret:@"3b08b349c0924a79869153bea334dd86" cusid:OLACUSID];
这个函数的参数的说明在OlamiRecognizer中有说明,也可以去在线API说明去查看
https://cn.olami.ai/wiki/?mp=sdk&content=sdk/ios/reference.html
有些参数必须去Olami的开发平台上注册才可以获的,网址是https://olami.ai,注册登陆以后创建应用才可以看到了
3 设置语系
[olamiRecognizer setLocalization:LANGUAGE_SIMPLIFIED_CHINESE];
在进行录音之前必须要先进行设置,否则会得不到结果。目前只支持简体中文(LANGUAGE_SIMPLIFIED_CHINESE)
4.开始录音
调用 start()接口开始进行录音
[olamiRecognizer start];
5得到录音的文字和语义,并对其进行处理
通过调用stop()函数或者自动停止,都会获得录音的文字和对其进行的语义分析的结果
实现OlamiRecognizerDelegate onResult函数可以获得结果,其结果以一个json字符串的形式回调过来,对这个字符串进行解析,就可以获得想要的股票的名称
[
{
"desc_obj": {
"status": 0
},
"semantic": [
{
"app": "stock",
"input": "招商银行的股价",
"slots": [
{
"name": "subject",
"value": "价格"
},
{
"name": "name",
"value": "招商银行"
},
{
"name": "type",
"value": "股票"
}
],
"modifier": [
"query"
],
"customer": "58df685e84ae11f0bb7b4893"
}
],
"type": "stock"
}
]
这个是根据OSL语法描述语言定义的一套规则,返回的结果。这个结果的说明在 https://cn.olami.ai/wiki/?mp=api_nlu&content=api_nlu3.html 这个网址上有说明。
看到这里大家可能会有疑惑,APP怎么知道我说的是什么意思呢?这就涉及到了OSL语法描述语言,OLAMI 语法描述语言(OLAMI Syntax Language,简称:OSL)是 OLAMI 平台针对自然语言处理所发展出的独特语法标记语言,自然语言语义互动(Natural Language Interaction, 简称:NLI)管理系统采用 OSL 取代复杂的编码编程,使用简单、容易学习而且灵活有弹性。可以在这个网址查看详细的说明
https://cn.olami.ai/wiki/?mp=osl&content=osl1.html
在编写这个APP之前,会按照OSL的要求编写好一套语法,这套语法可以被Olami的服务器所理解,并进行语义分析然后给出结果,就是上面的json字符串。在Olami官网上有写好的一些领域的模块,可以直接使用。在 https://cn.olami.ai/wiki/?mp=nli&content=nli1.html 网址可以看到介绍如何使用以后的模块。这个股票的grammar就是利用已有的模块来编写代码的。
6.创建应用,导入grammar
首先去olami的主页去登陆和注册。登陆以后转到这页面
在这里可以看到创建的stock这个应用。由于目前只支持创建五个应用,所以这里没有创建新应用这个接口。如果没有超过五个应用,则可以新添加接口。如下图所示
点击“创建新应用”,转到下面这个页面
填写 应用名称,应用描述,应用介绍以后,就可以创建了。回到上一个页面,就可以看到创建的应用了。
点击”进入NLI系统”就可以进入模块页面
在官网已经内置了很多领域的grammar.在模块页面大家点击“导入”按钮,查看已有领域的模块
选择一个要使用的,例如我要导入”stock”这个模块,先选择它,点击“导入” 按钮
然后点击“stock”模块,就可以进入股票模块,查看例句
但是这个时候还是不能使用,需要先进行发布。点击页面上方的”发布”按钮,进入发布页面
点击“发布按钮”
发布成功,就可以使用stock模块了
Olami还提供了测试grammar的功能,点击“测试”按钮,可以在页面进行测试grammar编写的是否正确,而不必要先开发APP
7 onResult函数说明
在整个程序中,最主要的一个函数就是onResult函数,他是一个语音识别回调代理的实现函数,在这里获得语音识别和语义识别的结果
- (void)onResult:(NSData *)result {
NSError *error;
__weak typeof(self) weakSelf = self;
NSDictionary *dic = [NSJSONSerialization JSONObjectWithData:result
options:NSJSONReadingMutableContainers
error:&error];
if (error) {
NSLog(@"error is %@",error.localizedDescription);
}else{
NSString *jsonStr=[[NSString alloc]initWithData:result
encoding:NSUTF8StringEncoding];
NSLog(@"jsonStr is %@",jsonStr);
NSString *ok = [dic objectForKey:@"status"];
if ([ok isEqualToString:@"ok"]) {
NSDictionary *dicData = [dic objectForKey:@"data"];
NSDictionary *asr = [dicData objectForKey:@"asr"];
if (asr) {//如果asr不为空,说明目前是语音输入
[weakSelf processASR:asr];
}
NSDictionary *nli = [[dicData objectForKey:@"nli"] objectAtIndex:0];
NSDictionary *desc = [nli objectForKey:@"desc_obj"];
int status = [[desc objectForKey:@"status"] intValue];
if (status != 0) {// 0 说明状态正常,非零为状态不正常
NSString *result = [desc objectForKey:@"result"];
dispatch_async(dispatch_get_main_queue(), ^{
});
}else{
NSDictionary *semantic = [[nli objectForKey:@"semantic"]
objectAtIndex:0];
[weakSelf processSemantic:semantic];
}
}else{
dispatch_async(dispatch_get_main_queue(), ^{
});
}
}
}
在这个函数中,调用了三个函数,分别来处理josn格式中的三个比较重要的节点
//处理ASR节点
- (void)processASR:(NSDictionary*)asrDic {
NSString *result = [asrDic objectForKey:@"result"];
if (result.length == 0) { //如果结果为空,则弹出警告框
}else{
}
}
这个用来处理ASR节点,获得语音识别的结果
//处理Semantic节点
- (void)processSemantic:(NSDictionary*)semanticDic {
NSArray *slot = [semanticDic objectForKey:@"slots"];
[_slotValue removeAllObjects];
if (slot.count != 0) {
for (NSDictionary *dic in slot) {
NSString *name = [dic objectForKey:@"name"];
if ([name isEqualToString:@"name"]) {//获得当前股票的名称
NSString* val = [dic objectForKey:@"value"];
[_slotValue addObject:val];
}
}
}
NSArray *modify = [semanticDic objectForKey:@"modifier"];
if (modify.count != 0) {
for (NSString *s in modify) {
[self processModify:s];
}
}
}
这个用来处理Semantic节点,这个节点中包含了slot的值和modifier的值。OSL 语法描述语言中的 slot 可理解为语义中的变量,用于传递、提取信息,是代码处理的数据的来源。这个程序来说,就是股票名称的来源。关于slot的值可以参考 https://cn.olami.ai/wiki/?mp=osl&content=osl_slot.html,这里有详细说明。
//处理modify
- (void)processModify:(NSString*) str {
if ([str isEqualToString:@"query"]) {//查询股票
NSString *name = _slotValue[0];
if (name) {
[self.delegate getStockName:name];
}
}
}
这个用来处理语音和语义的结果。这个函数主要是处理json字符串中的modifier节点。modifier 语法描述规则是 OSL 语法描述语言中,除了 slot 以外的另一种内置的信息传递机制,一般用来表示语义目的,也可以理解为对于语义的一种注释方式,以便让应用程序的开发者得知 grammar 所代表的相应意图。详细说明参考
https://cn.olami.ai/wiki/?mp=osl&content=osl_regex.html#11,通过modifier,我们才能知道程序的意图是什么。
源代码下载
https://github.com/lym-ay/OlamiStock
欢迎大家留言和讨论。
使用olami sdk实现一个语音查询股票的iOS程序的更多相关文章
- 使用Olami SDK 语音控制一个支持HomeKit的智能家居的iOS程序
前言 HomeKit是苹果发布的智能家居平台.通过HomeKit组件,用户可以通过iphone.iPad和ipod Touch来控制智能灯泡,风扇.空调等支持HomeKit的智能家居,尤其是可以通过S ...
- 语音识别完成诗句的查询功能,iOS AVSpeechSynthesis语音输出结果的诗歌APP
前言 当前的APP的查询都是使用手动输入,不仅效率低,而且查询的语句的限制比较大,不能够方便的扩展. 如果能方便的扩展查询语句,那么APP的使用就会有很大的灵活性.可以设计各种问句和语句,可以方便的和 ...
- 使用OLAMISDK实现一个语音输入数字进行24点计算的iOS程序
前言 在目前的软件应用中,输入方式还是以文字输入方式为主,但是语音输入的方式目前应用的越来越广泛.这是一个利用 Olami SDK 编写的一个24点iOS程序,是通过语音进行输入. Olami SDK ...
- 基于百度地图SDK和Elasticsearch GEO查询的地理围栏分析系统(2)-查询实现
在上一篇博客中,我们准备好了数据.现在数据已经以我们需要的格式,存放在Elasticsearch中了. 本文讲述如何在Elasticsearch中进行空间GEO查询和聚合查询,以及如何准备ajax接口 ...
- Entity Framework 6 Recipes 2nd Edition(13-4)译 -> 有效地创建一个搜索查询
问题 你想用LINQ写一个搜索查询,能被转换成更有效率的SQL.另外,你想用EF的CodeFirst方式实现. 解决方案 假设你有如下Figure 13-6所示的模型 Figure 13-6. A s ...
- MySQL GROUP_CONCAT函数使用示例:如何用一个SQL查询出一个班级各个学科第N名是谁?
如何用一个SQL查询出一个班级各个学科第N名是谁? 首先贴出建表语句,方便大家本地测试: -- 建表语句 CREATE TABLE score ( id INT NOT NULL auto_incre ...
- 把一个select查询结果插入到一个表(可选指定字段和值实例)
把一个select查询结果插入到一个表(可选指定字段和值实例) insert into bak (cc,yf) select cc,9 from ket insert into bak (cc,yf ...
- iOS 10中如何搭建一个语音转文字框架
在2016WWDC大会上,Apple公司介绍了一个很好的语音识别的API,那就是Speech framework.事实上,这个Speech Kit就是Siri用来做语音识别的框架.如今已经有一些可用的 ...
- 如何使用Add-on SDK开发一个自己的火狐扩展
黄聪:如何使用Add-on SDK开发一个自己的火狐扩展 火狐开放了扩展的开发权限给程序员们,相信很多人都会希望自己做一些扩展来方便一些使用. 我最近做一些项目也需要开发一个火狐扩展,方便收集自己需要 ...
随机推荐
- WEB跨域资源共享:Cross-origin Resource Sharing(CORS)
跨域资源共享(CORS):浏览器同源策略中的同源指协议+域名+端口三者完全一致,其中任何一个不同即为跨域 1. 浏览器同源政策是隔离潜在恶意文件的安全机制,限制信息传递和使用的边界,不是信息的保密机制 ...
- 基于JZ2440开发板编写bootloader总结(一)
凡走过必留下痕迹,学点什么都会有用的. 本系列博文总结了自己在学习嵌入式Linux编程过程中的收获,若有错误,恳请指正,谢谢! --参考教材韦东山系列教材 bootloader 是一个用于启动linu ...
- SNS团队第七次站立会议(2017.04.28)
一.当天站立式会议照片 本次会议主要内容:汇报工作进度,根据完成情况调整进度 二.每个人的工作 成员 今天已完成的工作 明天计划完成的工作 罗于婕 导入相关词库数据 研究如何存取语音.图片文件 龚晓 ...
- 【Alpha】——Sixth Scrum Meeting
一.今日站立式会议照片 二.每个人的工作 成员 昨天已完成的工作 今天计划完成的工作 李永豪 对统计出现的问题进一步完善 学习将项目做成APK 郑靖涛 完善报表设计 协助设计账目一览表板块 杨海亮 测 ...
- 201521123098 《Java程序设计》第13周学习总结
1. 本周学习总结 以你喜欢的方式(思维导图.OneNote或其他)归纳总结多网络相关内容. 1. TCP的特征: ①可靠:具有失败重传的功能: ②开销大:需要建立通路以维持通信: ③控制能力较强:有 ...
- 201521123075 《Java程序设计》第13周学习总结
1. 本周学习总结 协议 网络中为了进行数据交换(通信)而建立的规则.标准或约定(=语义+语法+规则),比如http, ftp等 IP层协议(Internet Protocol) Internet上的 ...
- 一个Markdown的例子
一个例子: 例子开始 1. 本章学习总结 今天主要学习了三个知识点 封装 继承 多态 2. 书面作业 Q1. java HelloWorld命令中,HelloWorld这个参数是什么含义? 今天学了一 ...
- SVN不出现绿色对勾的情况
就目前而言,我出现了两种情况. Num1:电脑云盘可能不兼容,导致无法出现svn提示小icon:----->删除云盘重新启动. Num2:被设置覆盖.----->鼠标右键-->Tor ...
- Eclipse rap 富客户端开发总结(4):如何搭建 rap 中文开发环境
Rap中文开发环境搭建大约分为2个部分 1. rap国际化,详细参加文章(rap开发经验总结(5)-rap国际化之路) 2.rap自带的JFace ,Dialog 等国际化 1.中文包下载地址: h ...
- appium实例编写(1)---以ContactsTest.apk 操作为例
详情参照 http://www.cnblogs.com/puresoul/p/4696825.html#3326873 自己练习一遍 前言: appium环境搭建参照另一篇博客:http:// ...