跨平台TTS eSpeak Windows开发
转摘请说明出处:http://www.cnblogs.com/luochengor/p/3511165.html以及作者,谢谢。
eSpeak是最为流行的开源跨平台的文本转语音程序。这两天进行了简单的研究。
先去网站看看吧! http://espeak.sourceforge.net/,网站很简洁,了解大概后下载需要的东西。这里下载两个包,分别是:
espeak-1.47.11-win.zip
espeak-1.47.11-source.zip
前者是一个完整的安装包,可以进行演示用,后者猜是开发要用的包。
通过阅读文档发现需要另一个开源软件的支持,PortAudio库:免费开源的跨平台音频播放库,支持Windows, Macintosh, Unix, SGI and BeOS等平台,以下工程都是在Microsoft Visual Studio 2008下完成编译。
一、 准备
1、PortAudio开源库 :本人用的是 pa_stable_v19_20111121.tgz
官方主页:http://www.portaudio.com/
2、依赖ASIO库:用于异步处理
3、依赖DirectX库:用于驱动声卡
二、步骤
1、将ASIO库 拷贝到 portaudio\src\hostapi\asio\目录下,即整个ASIOSDK文件夹放到portaudio\src\hostapi\asio\目录下。
2、安装DirectX库。
3、 用VS2008打开portaudio\build\msvc\portaudio.dsw (打开portaudio.sln)
4、可选:
官方说明:http://www.portaudio.com/trac/wiki/TutorialDir/Compile/Windows(参照设置)
http://www.portaudio.com/trac/wiki/TutorialDir/Compile/WindowsASIOMSVC(参照检查文件)
注:Finally, open the "pa_win_hostapis.c" file. Add the following:
#define PA_NO_WMME
#define PA_NO_DS
在Win32环境中是需要WMME和DS的。这两个define语句是需要加的。
DirectX库的安装目录默认为:C:\Program Files\Microsoft DirectX SDK (June 2010)
需要在工程内分别添加对DirectX SDK的头文件和lib的引用,即:
C:\Program Files\Microsoft DirectX SDK (June 2010)\include
lib根据自己需要有32位的和64位的,本人用的是32位的
C:\Program Files\Microsoft DirectX SDK (June 2010)\lib\X86
不然会提示,找不到dsound.h这个文件的错误。
编译生成的动态链接库portaudio_x86.dll、portaudio_x86.lib和portaudio.h是我们在eSpeak中可能要用到的。
解压espeak-1.47.11-source.zip,espeak-1.47.11-source\platforms\windows\目录下包含了windows_cmd、windows_dll、windows_sapi和espeakedit工程目录,里边都含有VC工程项目文件。
windows_cmd是生成espeak.exe命令行程序。
windows_dll是生成espeak_lib.dll动态链接库(本人主要想使用这个,通过函数调用实现文本转语音功能)。
windows_sapi是通过SAPI实现的动态链接库(需要Microsoft Speech SDK的支持)。
espeakedit生成espeakedit.exe
先从windows_cmd开始,阅读目录下的!ReadMe.txt,espeak-1.47.11-source\src下的文件全部拷贝到,espeak-1.47.11-source\platforms\windows\windows_cmd\src,不包括speech.h、stdint.h,将上面生成的portaudio_x86.dll、portaudio_x86.lib和portaudio.h,加入到工程内,如果没有意外的话这样编译就通过了,将生成的EXE和portaudio_x86.dll,拷贝到一个单独的文件夹下如C:\espeak-1. 47.11-source,现在可以在cmd模式下运行命令测试了:
C:\Documents and Settings\Administrator>cd C:\espeak-1. 47.11-source
C:\espeak-1.40.02-source> espeak --path="." -v en "hello"
Can't read data file: '\espeak-data\phontab'
Failed to load espeak-data
不要慌,看下提示说找不到文件,将espeak-1.47.11-source目录下的dictsource和espeak-data这两个文件夹复制到C:\espeak-1. 47.11-source目录下即可。
编译windows_dll工程,这是文章的重点,因为我们要使用它编译出来的动态链接库来进行编程开发。同样将espeak-1.47.11-source\src下的文件拷贝到espeak-1.47.11-source\platforms\windows\windows_dll\src下不覆盖speak_lib.h、speech.h、StdAfx.h、stdint.h文件。将上面生成的portaudio_x86.dll、portaudio_x86.lib和portaudio.h,加入到工程内(需要在附加依赖项中添加portaudio_x86.lib),进行编译,编译通过,生成了espeak_lib.dll、espeak_lib.lib,这样就可以写一个测试程序看看劳动成果。
通过阅读windows_dll工程目录下的!ReadMe.txt知道Windows下面eSpeak只支持AUDIO_OUTPUT_SYNCHRONOUS模式,使用 AUDIO_OUTPUT_SYNCHRONOUS模式要设置回调函数。新建一个空的控制台工程,当然了也需要将speak_lib.h、espeak_lib.dll、espeak_lib.lib加入到工程内,代码如下:
#include <iostream>
#include <string>
#include "speak_lib.h" using namespace std; #pragma comment(lib,"espeak_lib.lib") static int synthCallback(short *wav, int numsamples, espeak_EVENT *events) {
// 可以根据源码程序编写这部分代码实现生成语音文件功能。
return ;
} int main()
{
char text[] = "hello";
//包含espeak_data的目录
string path = "E:\\workspace\\Microsoft Visual Studio 2008\\09.EspeakDemo\\Debug"; espeak_Initialize(AUDIO_OUTPUT_SYNCH_PLAYBACK, , path.c_str(), ); // 设置回调函数
espeak_SetSynthCallback(synthCallback); // 设置中文
espeak_SetVoiceByName("zh+f2"); // 发音
espeak_Synth(text, , , POS_CHARACTER, , espeakCHARS_UTF8, NULL, NULL); // 等待发音结束
espeak_Synchronize(); espeak_Terminate(); return ;
}
运行测试吧,这回你一定有惊喜。说的是英文!想要说中文的话还用进行一些修改
char text[] = "hello"
改成
wchar_t text[] = L"你好";
espeak_Synth(text, , , POS_CHARACTER, , espeakCHARS_UTF8, NULL, NULL);
改成
espeak_Synth(text, , , POS_CHARACTER, , espeakCHARS_WCHAR, NULL, NULL);
虽然声音难听一点,但是也算可以。
参考文章:
1、http://cool.worm.blog.163.com/blog/static/6433900620097535713944/
2、http://wenku.baidu.com/view/52edd773f46527d3240ce00d.html?qq-pf-to=pcqq.c2c
转摘请说明出处:http://www.cnblogs.com/luochengor/p/3511165.html以及作者,谢谢。
跨平台TTS eSpeak Windows开发的更多相关文章
- 跨平台C/C++集成开发环境-Code::Blocks-内置GCC
Code::Blocks 是一个开放源码的全功能的跨平台C/C++集成开发环境. 相比于基于Delphi的Dev-C++共享C++IDE,Code::Blocks是开放源码软件.Code::Block ...
- 我的windows开发环境设定与日常使用指南
目录 开发相关的软件包安装.设定 Visual Studio 默认设定 鼠标右键添加"在此处打开cmd"选项 git gvim notepad++ VSCode-Insider C ...
- 一.1搭建跨平台的统一python开发环境
搭建跨平台的统一python开发环境: 使用开发环境的好处: 可不用在服务器上直接修改源代码---写的代码首先得入版本库(放git或giitlab中),在本地写代码提交到git中.然后在服务器上git ...
- 【windows开发实现记事本程序——逻辑篇1】
1. 主要内容 从本节开始介绍windows开发实现记事本程序的逻辑实现部分.本节的主要内容有以下3点: 1. 主窗口定义 -- 主要介绍记事本主界面窗口对应的窗口类及实现方案 2. RichEdi ...
- Windows开发中一些常用的辅助工具
经常有人问如何快速的定位和解决问题,很多时候答案就是借助工具, 记录个人Windows开发中个人常用的一些辅助工具. (1) Spy++ 相信windows开发中应该没人不知道这个工具, 我们常用 ...
- 跨平台移动框架iMAG开发入门
iMAG是一个非常简洁高效的移动跨平台开发框架,开发一次能够同一时候兼容Android和iOS平台,有点儿Web开发基础就能非常快上手.当前移动端跨平台开发的框架有非常多,但用iMAG另一个优点,就是 ...
- Spark+ECLIPSE+JAVA+MAVEN windows开发环境搭建及入门实例【附详细代码】
http://blog.csdn.net/xiefu5hh/article/details/51707529 Spark+ECLIPSE+JAVA+MAVEN windows开发环境搭建及入门实例[附 ...
- 虚拟机运行docker后映射端口到windows开发机
1.运行容器(以Oracle-xe-11g为例) 运行容器时先在虚拟机内映射端口 docker run -d -p 9090:8080 -p 1521:1521 wnameless/oracle-xe ...
- gcc for Windows 开发环境介绍
导读: 在Windows操作系统下的gcc 第一节 GCC家族概览 GCC是一个原本用于Unix-like系统下编程的编译器. 只是,如今GCC也有了很多Win32下的移植版本号.所以,或许对于很多W ...
随机推荐
- 文件操作 - 三元运算/chardet/文件操作r w/文件的操作方法
Alex:读书可以改变一个人的气质读书:豆瓣: 1年读20本 你的问题:想法太多,读书太少 书:追风筝的人,白鹿原 电影:阿甘正传 辛德勒名单---------------------------- ...
- jQuery EasyUI 简介
简介 jQuery EasyUI 是一个基于 jQuery 的框架,集成了各种用户界面插件. 特点: ①easyui 是一个基于 jQuery 的框架,集成了各种用户界面插件. ②easyui 提供建 ...
- "零代码”开发B/S企业管理软件之二:怎么创建数据源
声明:该软件为本人原创作品,多年来一直在使用该软件做项目,软件本身也一直在改善,在增加新的功能.但一个人总是会有很多考虑不周全的地方,希望能找到做同类软件的同行一起探讨. 本人文笔不行,能把意思表达清 ...
- 用python合并N个不同字符集编码的sql文件的实践
背景:我有一项工作任务是将svn某文件夹日常更新的sql文件(归类到日期命名的文件夹中)拿到数据库中运行. 一開始,我是先把sql文件update下来,用notepad++打开,拷贝每个文本的sql语 ...
- Deeplearning——动态图 vs. 静态图
动态图 vs. 静态图 在 fast.ai,我们在选择框架时优先考虑程序员编程的便捷性(能更方便地进行调试和更直观地设计),而不是框架所能带来的模型加速能力.这也正是我们选择 PyTorch 的理由, ...
- 用仿ActionScript的语法来编写html5——第四篇,继承与简单的rpg
第四篇,继承与简单的rpg 这次用继承自LSprite的类来实现简单的rpg的demo先看一下最后的代码与as的相似度 var backLayer; //地图 var mapimg; //人物 var ...
- 收藏一些好用的c语言数据结构
14.redis内置的链表,非常好 adlist.c /* adlist.c - A generic doubly linked list implementation * * Copyright ( ...
- selenium的下拉选择框
今天总结下selenium的下拉选择框.我们通常会遇到两种下拉框,一种使用的是html的标签select,另一种是使用input标签做的假下拉框. 后者我们通常的处理方式与其他的元素类似,点击或使用J ...
- HDOJ_1087_Super Jumping! Jumping! Jumping! 【DP】
HDOJ_1087_Super Jumping! Jumping! Jumping! [DP] Time Limit: 2000/1000 MS (Java/Others) Memory Limit: ...
- C#基元类型取值范围对照表
byte 无符号 8 为整数,值为0-255; sbyte 有符号8位整数,-128~127; short 有符号16位整数,范围在-32768~32767 ushort 无符号16位 ...