百度语音识别通过REST API的方式给开发人员提供一个通用的HTTP接口,基于该接口,开发人员能够轻松的获取语音识别能力,本文档描写叙述了使用语音识别服务REST API的方法。

长处:

较之开发人员经常使用的获取语音识别功能的方法,本方法最大的优势是轻量级。不须要在所开发的应用中集成不论什么SDK开发工具包,也不须要在測试机中加入不论什么识别引擎软件,开发人员仅仅要了解Http网络请求以及百度语音识别 REST API的使用规则。就可以轻轻松松在自己的应用中使用语音识别相关的功能了。

功能介绍:

REST API支持整段录音文件的识别,对录音格式有一定的要求。支持语音识别控件:集成提示音、音量反馈动效整套交互的对话框控件,方便开发人员高速集成。

原始PCM的录音參数必须符合8k/16k採样率、16bit位深、单声道。支持的压缩格式有:pcm(不压缩)、wav、opus、speex、amr、x-flac。

用法:

注冊开放平台及创新应用

注冊方法可參见之前写的百度语音识别开放平台SDK用法一文。当中有具体的注冊方法叙述。

从管理控制台进入创建的应用,例如以下图所看到的,API Key(client_id)和Secret Key(client_secret)即显示于当中, ID即为应用id(appid)。

依据百度OAuth的Client Credentials授权方式获取access_token。百度OAuth的Client Credentials和其它授权方式的说明见百度OAuth介绍的“百度支持的OAuth授权”部分。

当中,grant_type的值固定为client_credentials,client_id即为(3)中截图所看到的的 API Key的值,client_secret即为截图所看到的的Secret Key的值。更为具体的介绍请參见Client Credentials授权说明。

响应例如以下所看到的,当中access_token字段即为请求REST API所需的令牌, access_token有效期一般为一个月,开发人员须要对access_token。进行有效性推断,过期需又一次申请access_token。

API请求方式

 语音识别接口支持POST 方式

 眼下API仅支持整段语音识别的模式,即须要上传整段语音进行识别

 语音数据上传方式有两种:隐示发送和显示发送

 原始语音的录音格式眼下仅仅支持评測8k/16k採样率16bit位深的单声道语音

 压缩格式支持:pcm(不压缩)、wav、opus、speex、amr、x-flac

 系统支持语言种类:中文(zh)、粤语(ct)、英文(en)

 正式地址:http://vop.baidu.com/server_api

语音上传模型

语音数据和其它參数通过标准JSON格式串行化POST上传。 JSON里包含的參数:

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvenBmODg2MQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">





当中。开发人员能够把语音数据放在JSON序列的“speech”字段中,须要将语音先进行base64编码,并标明语音数据的原始长度。填写“len”字段。也能够直接提供语音下载地址放在“url”字段中。而且提供识别结果的回调地址。放在“callback”參数中。因此“speech”和“len”參数绑定,“url”和“callback”參数绑定,这张组參数二选一填写。假设都填。默认处理第一种。



表单类型在HTTP-HEADER里的content-type表明,例:



Content-length请填写JSON串的长度。

 上传实例:



 注意事项:

1, len字段表示原始语音长度。不是base64编码之后的长度。

2, speech和len字段绑定验证,url和callback绑定验证。两组參数二选一必填。假设都填,默认第一种方式。

3。 假设採用base64编码语音数据。数据量会增大1/3。

 显示发送:

语音数据直接放在HTTP-BODY中,控制參数以及相关统计信息通过REST參数传递。REST參数说明:





语音数据的採样率和压缩格式在HTTP-HEADER里的content-type表明,例:



Content-length请填写原始语音长度。

 URL演示样例:



下行接口定义

两种上传方式都返回统一的结果,採用 JSON格式封装。假设识别成功,识别结果放在JSON的“result”字段中,统一採用utf-8方式编码。



 识别成功返回case:

{\"err_no\":0,\"err_msg\":\"success.\",\"corpus_no\":\"15984125203285346378\",\"sn\":\"481D633F-73BA-726F-49EF-8659ACCC2F3D\",\"result\":[\"\\u6211\\u633a\\u5e05\\u554a\\uff0c\\u5e05\\u54e5\\uff0c\"]}

 识别错误返回case:

{"err_no":2000,"err_msg":"data empty.","sn":null}



错误码解释

33xx:系统内部模块交互错误,服务此时可能不太稳定。

34xx:參数错误,请检查上行參数。

30xx-32xx:后端错误。后端资源可能出现错误

因为篇幅所限,详细用法在下篇文章介绍。

百度语音识别REST API——通过使用Http网络请求方式获得语音识别功能的更多相关文章

  1. Android进阶(一)几种网络请求方式详解

    Ref:http://blog.csdn.net/zuolongsnail/article/details/6373051 Android应用经常会和服务器端交互,这就需要手机客户端发送网络请求,下面 ...

  2. IOS 网络请求方式

    iOS开发中的网络请求   今天来说说关于iOS开发过程中的网络请求. 关于网络请求的重要性我想不用多说了吧.对于移动客户端来说,网络的重要性不言而喻.常见的网络请求有同步GET, 同步POST, 异 ...

  3. 关于Web API中使用ajax发送请求方式的问题

    参见以下文章 http://www.west-wind.com/weblog/posts/2012/May/08/Passing-multiple-POST-parameters-to-Web-API ...

  4. 原生网络请求以及AFN网络请求/异步下载

    这里对网络请求方式做一个总结. 原生方式同步GET请求: NSString *urlStr = @"http://apis.juhe.cn/mobile/get?phone=13429667 ...

  5. 一步步搭建Retrofit+RxJava+MVP网络请求框架(一)

    首先,展示一下封装好之后的项目的层级结构. 1.先创建一个RetrofitApiService.java package com.xdw.retrofitrxmvpdemo.http; import ...

  6. Android4种网络连接方式HttpClient、HttpURLConnection、OKHttp和Volley优缺点和性能对比

    比较的指标: 1.cpu 2.流量 3.电量 4.内存占用 5.联网时间 功能点: 1.重试机制 2.提供的扩展功能 3.易用性 4.是否https 5.是否支持reflect api,OkHttp有 ...

  7. 【安卓网络请求开源框架Volley源码解析系列】定制自己的Request请求及Volley框架源码剖析

    通过前面的学习我们已经掌握了Volley的基本用法,没看过的建议大家先去阅读我的博文[安卓网络请求开源框架Volley源码解析系列]初识Volley及其基本用法.如StringRequest用来请求一 ...

  8. XDroidRequest网络请求框架,新开源

    XDroidRequest 是一款网络请求框架,它的功能也许会适合你.这是本项目的第三版了,前两版由于扩展性问题一直不满意,思考来 思考去还是觉得Google的Volley的扩展性最强,于是借鉴了Vo ...

  9. 基于RxJava2+Retrofit2简单易用的网络请求实现

    代码地址如下:http://www.demodashi.com/demo/13473.html 简介 基于RxJava2+Retrofit2实现简单易用的网络请求,结合android平台特性的网络封装 ...

随机推荐

  1. 让Fragment监听返回键

    Activity可以很容易的得到物理返回键的监听事件,而Fragment却不能.所以使用到了以下的方法. 首先创建一个抽象类BackHandledFragment,该类有一个抽象方法onBackPre ...

  2. Golang 做的几个跟性能有关的工具

    1.Vegeta https://github.com/tsenart/vegeta Vegeta 是一个万能的 HTTP 负载测试工具,提供命令行工具和一个开发包. 使用方法: $ vegeta a ...

  3. SSD Cloud Hosting–Linode-Mysql数据库的安装与配置

    接着上一篇的话题:SSD Cloud Hosting - Linode的配置和部署,搭建Java环境 8.Mysql数据库的安装与配置 安装 检查yum里边有没有mysql: yum list|gre ...

  4. 【LeetCode】9 & 234 & 206 - Palindrome Number & Palindrome Linked List & Reverse Linked List

    9 - Palindrome Number Determine whether an integer is a palindrome. Do this without extra space. Som ...

  5. javascript中=、==、===区别详解

    javascript中=.==.===区别详解今天在项目开发过中发现在一个小问题.在判断n==""结果当n=0时 n==""结果也返回了true.虽然是个小问题 ...

  6. NServiceBus-性能测试

    NServiceBus: 有效地处理一个消息 处理大量并发 尺度大小不同的服务器 尺度低规格的设备 的最终平衡速度和安全. 基准 许多参数会影响测量性能.最明显的是硬件服务器和CPU核的数量,大小的内 ...

  7. 关于Bean

    什么是Bean? 一个Bean 就是一个类.我们不必为制造任何的Bean而编写一些特殊的代码或者使用特殊的编程语言.事实上,我们唯一需要做的是略微地修改我们对我们方法命名的办法.方法名通知应用程序构建 ...

  8. freetds链接错误

    用tsql连接mssql出现下面的错误 tsql -H 192.168.1.100 -p 1433 -U sa Password: sa locale is "en_US.UTF-8&quo ...

  9. ntpd和ntpdate

    以无GUI 的Ubuntu 为例 1. ntpdate ntpdate是Ubuntu发行版的标配.按Ubuntu14.04的官方文档(这里),Ubuntu在启动时,会调用ntpdate,根据Ubunt ...

  10. SCU 4440 分类: ACM 2015-06-20 23:58 16人阅读 评论(0) 收藏

    SCU - 4440 Rectangle Time Limit: Unknown   Memory Limit: Unknown   64bit IO Format: %lld & %llu ...