摘要: 原创博客:转载请表明出处:http://www.cnblogs.com/zxouxuewei/ 1.首先安装 PocketSphinx 语音识别: $ sudo apt--pocketsphinx $ sudo apt-get install ros-indigo-pocketsphinx $ sudo apt-get install ros-indigo-audio-common $ sudo apt-get install libasound2 $ sudo apt--gconf(有…
PocketSphinx语音识别系统语言模型的训练和声学模型的改进 zouxy09@qq.com http://blog.csdn.net/zouxy09 关于语音识别的基础知识和sphinx的知识,详细能够參考我的另外两篇博文: 语音识别的基础知识与CMUsphinx介绍: http://blog.csdn.net/zouxy09/article/details/7941585 PocketSphinx语音识别系统的编译.安装和使用: http://blog.csdn.net/zouxy09/…
对于android 智能家居项目,如果能实现语音控制,无疑会丰富项目功能,改善用户体验,android语音识别的方法有三种:一是使用intent调用语音识别程序,二 是应用程序自己调用语音识别库,三是使用service调用语音识别程序,本文重点介绍第一种方法,一言以蔽之,其主要原理就是将语音发送到google 云端,然后云端处理,匹配数据,再发送给客户端. 1.需要通过intent传递语音识别的模式: Intent intent = new Intent(RecognizerIntent.ACT…
前端开发whqet,csdn,王海庆,whqet,前端开发专家 ladies and 乡亲们,程序猿同志们,周末仍然坚守工作岗位,或者学习不辍的童鞋们,福音来了. 语音识别高不高端.难不难? 今天给大家推荐一个简单易用的js实现的语音识别框架annyang,然后一个案例示范使用. 在线案例,下载收藏. annyang是一个能够实现语音识别的js类库,小巧易用(只2k),兼容中文.接下来我们看看怎么使用. 首先导入该annyang库,能够使用CDN的方式,也能够下载来使用. <!--下载到本地使用…
前言 HomeKit是苹果发布的智能家居平台.通过HomeKit组件,用户可以通过iphone.iPad和ipod Touch来控制智能灯泡,风扇.空调等支持HomeKit的智能家居,尤其是可以通过Siri进行语音控制. 但是通过Siri进行语音控制有个很大的问题,就是Siri支持的语料无法进行自由的扩展,没办法添加更多的说法.而Olami SDK则可以通过OSL(OLAMI 语法描述语言 OLAMI Syntax Language,简称:OSL)自由的进行扩展,对智能对话的能力扩展变得非常容易…
最近打算尝试一下OLAMI在游戏中应用的可能性,这里做一下记录. unity官方教程中的几个项目很精简,但看起来很不错,里面有全套的资源.最后我选择了tanks-tutorial来做这个实验. 下载和修改项目 首先按照教程下好项目,把坦克移动和射击的代码加上.这时就已经可以称的上是一个"游戏"了,可以控制坦克在地图上环游,也可以开炮.虽然缺少了挨揍的敌人,但是对设想的用语音控制坦克移动和射击已经足够了.这里我把地图扩大了一些,把坦克的速度降了一些,这样不至于几下就开到了地图的边缘. 准…
arduino 语音音箱 :语音控制.MP3播放.报时.回复温湿度情况 效果图 线路图 包装后的效果 功能 需要材料 arduino板 MP3播放模块及喇叭 时钟模块 温湿度模块 语音识别模块 面包板及其他线材.电阻 TF卡(用于储存音频) 原理 通过语音识别模块对使用者的语音指令进行与设置的指令匹配,匹配成功调用MP3模块播放对应音乐. 因为MP3播放需要一定的delay,但是由于系统自带的delay会阻塞arduino的操作,因此需要将大的延迟拆分成许多小块,每执行一个小块,就调用一次语音识…
分享 步骤及要点:1.在设置里打开siri.语音控制就自动关闭了.2.在siri里的"仅语言拨号"语言项里选择"土耳其文"或者"阿拉伯文".3.点击关闭siri按钮.大功告成.4.锁定iPhone,按HOME键试试吧. 原理解密:这个方法的原理就是,Siri支持的语言比语音控制多,在Siri下设置一个语音控制不支持的语言,然后关闭Siri,这时语音控制默认用Siri设置的语言,但是又不支持,所以无法打开!找不到土耳其语的解决方法:把siri先打开…
在上一篇博文中,我为大家介绍了myvoix.js中的smart learning模块,以及何如使用该功能.(myvoix.js的源码地址会在每一篇文章末尾放出) 文本将拓展 Chrome下的语音控制框架MyVoix.js使用篇(二) 中的实例(没看过的同学请猛戳链接),具象地介绍smart learning模块的使用.在之前的实例中,我们通过语音输入,让 Hello My Voix 标题变化成各种颜色, 并且通过预存指令来增加语音指令的识别率.在本文中将去除预存指令这一块,通过smart lea…
总链接:  https://www.arduino.cn/thread-78393-1-1.html 语音控制:https://doc.blinker.app/?file=005-App%E4%BD%BF%E7%94%A8/04-%E8%AF%AD%E9%9F%B3%E6%8E%A7%E5%88%B6 ### 软件准备  **下载并安装Arduino IDE** ()   [点击去下载](https://www.arduino.cn/thread-5838-1-1.html)  **下载并安装e…
前些天闲着没事,就做了个语音识别结合串口发送指令的软件,用的是pyqt写的,软件打开后对着笔记本的话筒说话, 他就能识别返回文字结果,然后匹配语音中的关键词,如果有关键词就发送关键词对应的命令,比如语音中包含“开灯”, 就会发送“on”这个字符串到单片机,单片机再进行工作.(无串口连接也可做语音识别,连上后可发送命令到串口). 下面是分享的资源代码:   链接:https://pan.baidu.com/s/1eWT_BhAzJUGlafZUJhI2VQ 提取码:nh08 打开软件开场界面: 软…
一直想做一个可以录音的可执行JAVA APP,实现自然语言对话. 第一步就是实现把录音转成语义,比如你对着话筒说"你好",你获取回答相应的回复.你对着话筒说"今天的天气",能够回复你今天的天气,或者至少告诉你,你输入的语句含义是"查今天的天气". 我决定用欧拉蜜语义开放平台的内置功能------智能对话模块做一个实验. 代码下载:JAVA SDK--windows录音+语音识别实例源码 源码解析 1. 在欧拉蜜开放平台上注册,然后进入创建自己的应…
需要的准备的硬件arduino+PC+麦克风实现语音命令控制LED灯的亮灭. 首先需要将写好的arduino程序烧录到arduino uno主板中,下面是代码如下: int val;//定义变量val int ledpin=10;//定义数字接口13 void setup() { Serial.begin(9600);//设置波特率为9600,这里要跟软件设置相一致.当接入特定设备(如:蓝牙)时,我们也要跟其他设备的波特率达到一致. pinMode(ledpin,OUTPUT);//设置数字10…
  简介 之前参与过114对话系统的项目,中间搁置很久,现在把之前做过的内容整理一下,一是为自己回顾,二是也希望分享自己看的内容,中间也遇到一些问题,如果您可以提一些建议将不胜感激. 114查询主要分为4个任务,该对话系统希望通过构建神经网络学习模型,以实现将传统的需要接线员回复用户问题的方式,转换为可以实现机器自动回复用户问题的智能对话.由于拿到的是114电话录音数据,并没有标记好的文本,加上语音中有当地方言.特定字母数字在现有商用转录识别效果差等问题,所以需要自己实现语音识别的模块,以便后期…
最近打算研究一下语音识别,但是发现网上很少有C#的完整代码,就把自己的学习心得放上来,和大家分享一下. 下载API: 1)SpeechSDK51.exe                   (67.0 MB) 2)SpeechSDK51LangPack.exe     (81.0 MB) API可以不下载,但是如果你的VS是英文版,但是想使用中文的语音,那你就需要下载API,按顺序安装好. (PS:我的VS是英文的,不能说中文,为了这个我纠结了一上午.API下载地址,感谢:XAF ,http:/…
日前因工作需求,着手研究了语音识别技术,发现github上有网友发布了一款叫做voix.js的javascript框架.在拜读voix.js的源码后发现了不少问题,于是自己写了一款语音识别框架MyVoix. 话不多说,下面将介绍MyVoix框架的使用.首先敬上MyVoix源码地址. 使用前和别的js库一样,我们需要引入myvoix.js文件 <script src="myvoix.js"></script> 上面的代码是传统的加载javascript文件的方法,…
语音驱动程序  drv_voice.c 语音服务程序  srv_voice.c 1.先运行初始化函数,主要是设置初始音量,并建立一个软件定时器来,以10ms的周期来调用语音播放函数. 1 void srvVoiceInit() 2 { 3 T_SOFT_TIMER_HANDLE hSoftTimer; 4 UINT16 usVoiceVolumeTunerAdjust; 5 6 g_hVoiceDevHandle = osalDevOpen(GEN20_PROTO_VOICE_DEV_NAME)…
上一篇博文中,初步介绍了MyVoix.js的基本功能,这次我们将演示一个完整的实例. 先上代码 <!DOCTYPE HTML> <html> <head> <title>MyVoix</title> <script type="text/javascript" src='js/myvoix.js'></script> <script type="text/javascript"…
上篇文末已经提及,google分析出的单词可能和大家预想的输入有差别.上文我们通过预先绑定多个语音指令,权益地解决了这个问题.在这一章,我将介绍myvoix.js框架自带的smart learning模块,为解决发音不标准的问题提供更多的解决方案. 要使用Smart Learning我们首先要介绍下,什么是Smart Learning?简单地说,通过Smart Learning模块,myvoix可以记忆一个指令相关的发音,同时支持localstorage的读写. 启动Smart Learning…
基于meanshift的手势跟踪与电脑鼠标控制(手势交互系统) zouxy09@qq.com http://blog.csdn.net/zouxy09 一年多前开始接触计算机视觉这个领域的时候,年幼无知,倍感吃力.当年惶恐,从而盲从.挣扎了不少时日,感觉自己好像还是处于领域的门外汉一样,在理论与实践的鸿沟中无法挣脱,心里空落落的.在这种挥之不去的烦忧中,某个时候豁然开朗,觉得要看一个系统的代码了,看看别人是怎么写的,理论又是怎么用在实践上的.然后自己就瞄准了TLD这个被炒作地很火的跟踪算法.花了…
http://blog.csdn.net/zouxy09/article/category/1218765 图像卷积与滤波的一些知识点 图像卷积与滤波的一些知识点zouxy09@qq.comhttp://blog.csdn.net/zouxy09       之前在学习CNN的时候,有对卷积经常一些学习和整理,后来就烂尾了,现在稍微整理下,先放上来,以提醒和交流.一.线性滤波与卷积的基本概念      线性滤波可以说是图像处理最基本的方法,它可以允许我们对图像进行处理,产生很多不同的效果.做法很…
前言:这个项目是在2016-2017完成的,做的很浅显,贴出来与大家分享,希望能有帮助. 摘要 本项目主要是针对脑电信号控制的智能轮椅的设计,脑电控制是智能医疗领域的重要研究方向,旨在帮助行动不便但智力清晰的老年人和残疾人士重获自主行动能力,使用者可以自主上的控制轮椅的前进.左拐.右拐.停止等运动. 本项目以STM32单片机为核心器件,包括脑电波采集及处理模块(以下简称脑电模块),电机驱动模块,语音控制模块,APP-WIFI控制模块和软件设计模块.控制系统不仅可以实现脑电与眼电信号相结合的混合脑…
代码地址如下:http://www.demodashi.com/demo/12946.html Python实时语音识别控制 概述 本文中的语音识别功能采用 百度语音识别库 ,首先利用 PyAudio 库录制语音指令,保存为受支持的 wav 音频文件,然后利用 百度语音识别库 提供的方法实现语音识别,最后检测识别结果,利用 PyUserInput 库提供的方法模拟控制web页面滚动. 百度语音识别为开发者提供业界优质且免费的语音服务,通过场景识别优化,为车载导航,智能家居和社交聊天等行业提供语音…
  因为最近在研究语音识别,所以借鉴了一下CreAmazing网友的帖子 Android系统本身其实提供有语音识别模块,在它的APIDemo里也有关于语音识别的sample,不过经过大多开发者的真机测试,发现很多真机并不能使用哪个sample,在网上查找了一下原因,大部分是因为开发者在刷机的时候,大部分的ROM都阉割掉了语音识别和语音合成TTS(Text To Speech)部分,所以运行sample的时候会有异常抛出. 如果不用google提供的语音识别,要怎么实现语音识别喃?科大讯飞的语音A…
最近在用soket实现终端控制器的功能,然后就想用语音控制,这样显得更AI WechatSI在manifest.json中配置: 在vue中插入如下展示代码: <view class="voice-content">语音识别内容:<text class="text holy-font">{{currentText}}</text></view> 如果需要按住按钮说话,松开回调: <button class=&qu…
代码地址如下:http://www.demodashi.com/demo/13153.html 概述: 本demo是ros下基于百度语音的,语音识别和语音合成,能够实现文字转语音,语音转文字的功能. 详细: 1. 安装库与环境 首先确保已经安装了以下两个库文件. 1.1 Python 音频处理库 PyAudio python -m pip install pyaudio 1.2 Python 音频处理库 vlc pip install python-vlc 1.3 ROS 确保安装了ROS ht…
作者QQ:(648437169) 点击下载➨百度语音         语音识别api文档         语音合成api文档 [Delphi 百度语音]支持获取 Access Token.语音识别.语音合成.语音下载等功能…
0. 太长不看系列,直接使用 在1.2官网注册后拿到APISecret和APIKey,直接复制文章2.4demo代码,确定音频为wav格式,采样率为16K,在命令行执行 python single_sentence_recognition.py -client_secret=你的client_secret -client_id=你的client_id -file_path=test.wav 识别结果 ​ 使用中有任何问题,欢迎留言提问. 1. Python调用标贝科技语音识别接口,实现语音转文字…
离线语音Snowboy热词唤醒 语音识别现在有非常广泛的应用场景,如手机的语音助手,智能音响(小爱,叮咚,天猫精灵...)等. 语音识别一般包含三个阶段:热词唤醒,语音录入,识别和逻辑控制阶段. 热词唤醒就是唤醒设备,让设备解析你接下来说的话.通常设备一直在录入周围的声音,但是设备此时不会有任何反应.当通过像「Hi,Siri」这样的唤醒词被唤醒以后,设备就开始处理接下来的声音了.热词唤醒是语音识别的开始. Snowboy 是比较流行的热词唤醒框架,目前已经被百度收购.Snowboy 对中文支持友…
一.语音识别包 1.安装         安装很简单,直接使用ubuntu命令即可,首先安装依赖库: $ sudo apt-get install gstreamer0.10-pocketsphinx $ sudo apt-get install ros-indigo-audio-common //我安装的是indigo版本的 $ sudo apt-get install libasound2 $ sudo apt-get install gstreamer0.10-gconf 然后来安装ROS…