百度语音开发介绍文档:

http://yuyin.baidu.com/docs/asr#

使用语音识别,需要在百度申请一个应用,然后拿到API Key和Secret Key,然后才可以使用语音识别

ps:我的示例里面有放了一组可用的Key,但是仅供各位测试使用,有需要开发App的请自行申请,放在示例中的Key我可能随时会撤销。

ps:编译需要开启C++11的支持

ps:我写示例在OS X下是没问题的。但是当我移植到Windows下的时候,在刷新token那一步有问题,貌似和https有关,等到我想到解决方法的时候回来更新。

ps:示例里,在刷新token的地方我直接写了apikey的明文字符串,应该替换成m_apiKey,请手动替换。本页面中我已经更改了。

直接上代码

.h头文件部分

  1. class BaiduVop: public QObject
  2. {
  3. Q_OBJECT
  4. private:
  5. QAudioDeviceInfo m_currentDevice;
  6. QString m_apiKey;
  7. QString m_secretKey;
  8. QString m_token;
  9. QAudioInput *m_audioInput = NULL;
  10. QByteArray m_buf;
  11. QBuffer *m_buffer = NULL;
  12. JasonQt_Net::HTTP m_http;
  13. public:
  14. BaiduVop(const QString &apiKey, const QString &secretKey);
  15. void setDevice(const QAudioDeviceInfo &device);
  16. public slots:
  17. bool refreshToken(void);
  18. bool start(void);
  19. std::pair<bool, QString> finish(void);
  20. };

.cpp实现文件

  1. BaiduVop::BaiduVop(const QString &apiKey, const QString &secretKey):
  2. m_apiKey(apiKey),
  3. m_secretKey(secretKey)
  4. {
  5. const auto &&availableDevices = QAudioDeviceInfo::availableDevices(QAudio::AudioInput);
  6. if(!availableDevices.isEmpty())
  7. {
  8. m_currentDevice = availableDevices.first();
  9. QAudioFormat format;
  10. format.setSampleRate(8000);
  11. format.setChannelCount(1);
  12. format.setSampleSize(16);
  13. format.setSampleType(QAudioFormat::SignedInt);
  14. format.setByteOrder(QAudioFormat::LittleEndian);
  15. format.setCodec("audio/pcm");
  16. m_audioInput = new QAudioInput(m_currentDevice, format, this);
  17. }
  18. }
  19. void BaiduVop::setDevice(const QAudioDeviceInfo &device)
  20. {
  21. m_currentDevice = device;
  22. }
  23. bool BaiduVop::refreshToken(void)
  24. {
  25. QNetworkRequest request(QUrl(QString("https://openapi.baidu.com/oauth/2.0/token?")));
  26. QByteArray append = QString("grant_type=client_credentials&client_id=%1&client_secret=%2&").arg(m_apiKey, m_secretKey).toLatin1();
  27. QByteArray buf;
  28. request.setRawHeader("Content-Type", "application/json");
  29. const auto &&flag = m_http.post(request, append, buf, 15000);
  30. if(!flag) { return false; }
  31. const auto &&data = QJsonDocument::fromJson(buf).object();
  32. if(data.isEmpty() || !data.contains("access_token")) { return false; }
  33. m_token = data["access_token"].toString();
  34. return true;
  35. }
  36. bool BaiduVop::start(void)
  37. {
  38. if(m_token.isEmpty())
  39. {
  40. qDebug("BaiduVop::start fail, Need refresh token befor start.");
  41. return false;
  42. }
  43. m_buffer = new QBuffer;
  44. m_buffer->open(QIODevice::ReadWrite);
  45. m_audioInput->start(m_buffer);
  46. return true;
  47. }
  48. std::pair<bool, QString> BaiduVop::finish(void)
  49. {
  50. m_audioInput->stop();
  51. const auto &sendData = m_buffer->data();
  52. m_buffer->deleteLater();
  53. QNetworkRequest request(QUrl("http://vop.baidu.com/server_api"));
  54. QJsonObject append;
  55. request.setRawHeader("Content-Type", "application/json");
  56. append["format"] = "pcm";
  57. append["rate"] = 8000;
  58. append["channel"] = 1;
  59. append["token"] = m_token;
  60. append["lan"] = "zh";
  61. append["cuid"] = "JasonQt";
  62. append["speech"] = QString(sendData.toBase64());
  63. append["len"] = sendData.size();
  64. QByteArray buf;
  65. m_http.post(request, QJsonDocument(append).toJson(), buf, 15000);
  66. QJsonObject acceptedData(QJsonDocument::fromJson(buf).object());
  67. if(buf.isEmpty() || acceptedData.isEmpty() || !acceptedData.contains("result")) { return { false, buf }; }
  68. const auto &&message = acceptedData["result"].toArray()[0].toString();
  69. return { true, message.mid(0, message.size() - 1) };
  70. }

其中有几个http的接口已经被我封装了,需要自行开发的请更改代码或者直接下载我的示例,里面有完整的工程。

可以到下方链接中下载

http://download.csdn.net/detail/wsj18808050/8659091

http://blog.csdn.net/wsj18808050/article/details/45478983

使用百度语音识别REST API,做全平台语音识别的更多相关文章

  1. 百度语音识别REST API——通过使用Http网络请求方式获得语音识别功能

    百度语音识别通过REST API的方式给开发人员提供一个通用的HTTP接口,基于该接口,开发人员能够轻松的获取语音识别能力,本文档描写叙述了使用语音识别服务REST API的方法. 长处: 较之开发人 ...

  2. 百度语音识别REST API用法(含JAVA代码)——不须要集成SDK的方法

    版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/zpf8861/article/details/32329457 上一篇文章http://blog.c ...

  3. Linux VPS使用百度网盘API上传备份文件

    最近百度网盘将空间升级到了永久1TB,鉴于百度的实力用做数据备份空间不错,不过百度网盘没有Linux下的客户端,上传管理文件需通过百度开放云平台访问PCS资源的系列接口. 1.首先加入百度开发者:ht ...

  4. 可能是目前市面上唯一能够支持全平台的RTMP推流组件:Windows、Linux、Android、iOS、ARM

    EasyRTMP是什么? EasyRTMP是一套RTMP直播推送功能组件,内部集成了包括:基本RTMP协议.断线重连.异步推送.环形缓冲区.推送网络拥塞自动丢帧.缓冲区关键帧检索.事件回调(断线.音视 ...

  5. .NET之全平台一体化的体验

    一.前言 近来利用空闲时间研究了一下Xamarin的技术,想想既然提供了如此好的支持,就该尝试一切可能,来一个”大小通吃“. 何为全平台:APP包括Android.IOS.WP,WEB可在Window ...

  6. 百度地图JavaScript API覆盖物旋转时出现偏移

    在项目中,调用百度地图JavaScript API,做覆盖物的旋转再添加到地图上,结果出现偏移了. 调试过程中的效果图: 发现图片的旋转并不是按车子的中心来的,而是之外的一个点.最后发现犯了一个很细节 ...

  7. NET之全平台一体化

    NET之全平台一体化的体验 一.前言 近来利用空闲时间研究了一下Xamarin的技术,想想既然提供了如此好的支持,就该尝试一切可能,来一个”大小通吃“. 何为全平台:APP包括Android.IOS. ...

  8. WPF技术触屏上的应用系列(二): 嵌入百度地图、API调用及结合本地数据库在地图上进行自定义标点的实现

    原文:WPF技术触屏上的应用系列(二): 嵌入百度地图.API调用及结合本地数据库在地图上进行自定义标点的实现 去年某客户单位要做个大屏触屏应用,要对档案资源进行展示之用.客户端是Window7操作系 ...

  9. 百度地图JavaScript API使用

    最近在完成优达学城前端开发(入门)课程的P4项目中,要求调用google地图进行交互,项目已提供部分js代码和html代码.但在申请google地图API密钥时由于网络等原因,打不开或者连接超时,所以 ...

随机推荐

  1. Ubuntu package managerment tools

    Visual demostration References Understanding differences between dpkg and apt-get/aptitude tools. A ...

  2. windows系统——mysql自动定时备份数据库的最佳方法

    网上有很多关于window下Mysql自动备份的方法,可是真的能用的也没有几个,有些说的还非常的复杂,难以操作. 我们都知道mssql本身就自带了计划任务可以用来自动备份,可是mysql咱们要怎么样自 ...

  3. JavaScript中的Math.ceil()、Math.round()、Math.floor()

    1. Math.ceil():向上取整(指取大于该浮点数的最小整数) 2. Math.round():四舍五入取整(注意:当该浮点数距离两端整数一样时,取较大的那个整数,如Math.round(-1. ...

  4. hdu 2509 Be the Winner 博弈

    题目链接 有n堆苹果, 对于其中的每一堆的x个苹果, 它是放在一条线上的. 你每次可以对一堆苹果进行操作, 可以取y个, 1<=y<=x. 然后如果你是取的一条线上中间的苹果, 那么这一堆 ...

  5. 通过实例深入理解lec和yacc

    本框架是一个lex/yacc完整的示例,包括详细的注释,用于学习lex/yacc程序基本的搭建方法,在linux/cygwin下敲入make就可以编译和执行.大部分框架已经搭好了,你只要稍加扩展就可以 ...

  6. 您在基于 Windows 7 的或基于 Windows Server 2008 R2 的计算机上读取器中插入智能卡时出现错误消息:"设备驱动程序软件未能成功安装"

    http://support.microsoft.com/kb/976832/zh-cn http://support.microsoft.com/kb/976832/zh-tw 症状 当智能卡插入智 ...

  7. [技巧]使用Xcode集成的HeaderDoc自动生成注释和开发文档

    [技巧]使用Xcode集成的HeaderDoc自动生成注释和开发文档     Doxygen本来是一个很好的工具,可是我感觉在mac系统下,如果用doxygen最后生成的CHM文件感觉就不是那么恰当, ...

  8. Ribbon Gymnastics

    Robert is a gymnastics coach. Unfortunately, he got four gymnastics beginners to attend the coming c ...

  9. SQL分类取每一类第一项

    实际应用中经常会碰到这样的需求,在给定的数据集中要求返回每一类型中最大的一条,抑或是最小的一条,抑或是按时间排序最近的一条等等.很多人面对这样的需求显得束手无策,其实这个需求实现有很多种方法,今天给大 ...

  10. Subsequence(暴力+二分)

    Subsequence Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 10875   Accepted: 4493 Desc ...