操作环境

Python版本: anaconda3 python3.7.4

操作系统: Ubuntu19.10

编译器: pycharm社区版

用到的模块: pyttsx3,requests

pysstx3模块介绍

pyttsx3官网地址

pyttsx3(Text to Speech)是一个语音转换模块,它可以在离线的环境下工作,支持多个引擎,而且兼容于Python2和Python3.

首先下载pyttsx3模块

pip install pyttsx3

(Windows系统)若你没有安装pywin32模块,则还需安装此模块作为pyttsx3模块的依赖

安装pywin32

pip install pywin32

这个模块很奇怪,下载的过程中经常会报错,试了几台电脑和不同操作系统的结果也是一样,在检查网络和其他因素无误后多试几次就可以成功安装此模块.

安装成功提示如下图



注意:这个模块运行必须在python3.7.4版本及以下才可以运行,否则会由于版本过高报错

如果不知道自己的Python版本是多少,可以再终端输入,输出的第一行就是目前使用的Python版本号

测试pyttsx3库

根据官网给出的简单示范,我们可以测试一下是否可以使用本模块

测试代码:

import pyttsx3

engine = pyttsx3.init()
engine.say("I will speak this text")
engine.runAndWait()

若可以听到一个男声快速的说了一遍我们引用的句子,则证明本模块安装已经成功

自定义修改朗读的语调、音色等参数

也是参照官方文档,将这些参数调整成一个比较舒服的状态

import pyttsx3

engine = pyttsx3.init() # 创建对象

""" 语速 """
rate = engine.getProperty('rate') # 获取当前语速(默认值)
print (rate) # 打印当前语速(默认值)
engine.setProperty('rate', 175) # 设置一个新的语速 """音量"""
volume = engine.getProperty('volume') # 获取当前的音量 (默认值)(min=0 and max=1)
print (volume) # 打印当前音量(默认值)
engine.setProperty('volume',1.0) # 设置一个新的音量(0 < volume < 1) """音色"""
voices = engine.getProperty('voices') # 获取当前的音色信息
engine.setProperty('voice', voices[0].id) # 改变中括号中的值,0为男性,1为女性 engine.say("Hello World!")
engine.runAndWait()
engine.stop()

在Windows系统中,这一段代码已经可以通过pyttsx3模块说出中文了,但是在Linux操作系统中,还需要修改一个参数

engine.setProperty('voice','zh')             //将音色中修改音色的语句替换

开始制作有声小说

通过刚才对pyttsx模块的讲解,我们已经可以了解到该模块的基本原理以及各个参数所代表的含义,接下来我们就以pyttsx3模块为基础构建一个简单的有声小说.

基本思路

使用爬虫requests模块将小说文本从从网上下载到本地,并将内容保存在一个文本文件中,然后打开文本文件,调用pyttsx3模块对文字进行识别,并朗读出来.

操作步骤

首先找到一个小说网站(我选择的是新笔趣阁小说网 因为这个网站没有设置反爬机制 比较适合我们练手)

然后随便找到一个小说,进入它的目录页,借助谷歌浏览器的插件xpath helper利用xpath语法提取到每一章小说

点进小说的内容页,同样利用插件提取到内容

然后就可以开始构建爬取小说的代码了

为了节省时间,我先简单的爬取一个章节

import requests
from lxml import etree def main():
#小说的详情页
url = 'http://www.xbiquge.la/10/10489/'
#请求内容
response = requests.get(url).text
#转化成xpath语法可以提取的形式
html = etree.HTML(response)
#提取小说内容页的网址
data = html.xpath("//div[@class='box_con'][2]/div[@id='list']/dl/dd/a/@href")
#为了节省时间,先只提取一个章节的内容
sound = data[1]
#构造小说内容页的网址
new_url = 'http://www.xbiquge.la' + str(sound)
#请求
response_1 = requests.get(new_url).content
html_1 = etree.HTML(response_1)
data_1 = html_1.xpath("//div[@id='content']/text()")
#用replace方法将提取到文本中的\xa0替换掉
noval = str(data_1).replace('\\xa0', '')
#替换掉\r
noval_1 = noval.replace("\\r',", '')
#将爬取到的小说内容存储到文本文件中
with open('xiaoshuo.txt','w') as f:
f.write(noval_1) if __name__ == '__main__':
main()

运行完成之后,就可以发现当前文件夹下多出了一个名为xiaoshuo.txt的文件,这就是我们爬取到的小说内容

导入有声阅读模块

def say(filename='xiaoshuo.txt'):
with open(filename, 'r') as f:
line = f.read()
engine = pyttsx3.init()
engine.setProperty('volume',1.0)
engine.setProperty('rate', 175)
engine.setProperty('voice', 'zh')
engine.say(line)
engine.runAndWait()

最后再设置一个可以选择章节的接口传入主函数,运行程序即可听到有声小说的内容

完整代码

import requests
from lxml import etree
import pyttsx3 def main(a):
#小说的详情页
url = 'http://www.xbiquge.la/10/10489/'
#请求内容
response = requests.get(url).text
#转化成xpath语法可以提取的形式
html = etree.HTML(response)
#提取小说内容页的网址
data = html.xpath("//div[@class='box_con'][2]/div[@id='list']/dl/dd/a/@href")
#为了节省时间,先只提取一个章节的内容
sound = data[int(a)]
#构造小说内容页的网址
new_url = 'http://www.xbiquge.la' + str(sound)
#请求
response_1 = requests.get(new_url).content
html_1 = etree.HTML(response_1)
data_1 = html_1.xpath("//div[@id='content']/text()")
#用replace方法将提取到文本中的\xa0替换掉
noval = str(data_1).replace('\\xa0', '')
#替换掉\r
noval_0 = noval.replace("\\r',", '')
noval_1 = noval_0.replace('[', '')
#将爬取到的小说内容存储到文本文件中
with open('xiaoshuo.txt','w') as f:
f.write(noval_1) def say(filename='xiaoshuo.txt'):
with open(filename, 'r') as f:
line = f.read()
engine = pyttsx3.init()
engine.setProperty('volume',1.0)
engine.setProperty('rate', 175)
engine.setProperty('voice', 'zh')
engine.say(line)
engine.runAndWait() if __name__ == '__main__':
a = input('输入想要朗读的章节(数字):')
main(a)
say()

等你运行完这个程序,你就会发现机器人的声音实在是太难听了.如果想要做更加清晰的有声小说,可以调用百度人工智能的api接口来实现这个功能

Python模块---制作属于自己的有声小说的更多相关文章

  1. Python实战:下载鬼灵报告有声小说

    在家无聊,想看看小说,不过看的眼睛痛,就想着下个有声小说来听听.但风上找到的都是要一集一集下,还得重命名,122集啊,点到什么时候. 写个批处理下载的脚本.记录下过程. 一.老套路了,找到下载URL. ...

  2. Python模块制作

    在Python中,每个Python文件都可以作为一个模块,模块的名字就是文件的名字. 定义自己的模块 比如有这样一个文件test.py,在test.py中定义了函数add def add(a,b): ...

  3. Python模块---制作新冠疫情世界地图()

    目录 pyecharts模块 简介 安装pyecharts 测试pyecharts模块 pyecharts实战:绘制新冠肺炎疫情地图 需求分析 请求数据 提取数据 处理数据 制作可视化地图 设置可视化 ...

  4. python生成有声小说模拟真人发音

    生成有声小说原理 文字是1500字内的生成微软文档说说 用代码实现小说爬取正本 实现每章小说1450字 实现自动剪切后添加封面 实现自动上传 用python代码实现爬取小说,本案列以一本小说为实列代码 ...

  5. python模块大全

    python模块大全2018年01月25日 13:38:55 mcj1314bb 阅读数:3049 pymatgen multidict yarl regex gvar tifffile jupyte ...

  6. Python模块常用的几种安装方式

    Python模块安装方法 一.方法1: 单文件模块直接把文件拷贝到 $python_dir/Lib 二.方法2: 多文件模块,带setup.py 下载模块包,进行解压,进入模块文件夹,执行:pytho ...

  7. 大话python模块与包

    前言 眼看着老掌门年纪越来越大,掌门之位的传承也成了门派中的一件大事.这天,老掌门把小掌门叫到跟前,语重心长地说道:孩子啊,以后你就要继任掌门之位了,我就传授此生所学的绝世功法与你,以后可要悉心学习, ...

  8. python 模块和包

    一,模块 1,什么是模块? 常见的场景: 一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py 的后缀. 但其实 import 加载的模块分为四个通用类别: 1,使用pyt ...

  9. python模块学习第 0000 题

    将你的 QQ 头像(或者微博头像)右上角加上红色的数字,类似于微信未读信息数量那种提示效果. 类似于图中效果: 好可爱>%<! 题目来源:https://github.com/Yixiao ...

随机推荐

  1. js实现字符串逆向输出的4种方式

    一.第一种方式(利用charAt()这个函数实现) 代码如下: var str="你好世界!!!!"; var str1="";//这里创建一个空字符串用来拼接 ...

  2. Effective Go笔记

    一 格式化 使用gofmt程序对go源码进行格式化,以便统一编码风格,可直接在GoLand进行配置[1].Go源码格式使用tab作为缩进,且很少使用括号. 二 注释 Go支持块注释/**/和行注释// ...

  3. vue 开发时候 nginx绑定多个系统 爆红 sockjs-node/info?t

    如果你的浏览器,与NPM服务器,不是同一个机器(不是localhost),那么会导致这个报错. 我搜索了好久,才发现这个是可以在webpackjs里配置的(即vue.config.js): https ...

  4. 改变 C/C++ 控制台程序的输出颜色和样式

    我们经常可以看见Linux自带终端下的许多程序都输出了不同颜色和底纹的字体.最近也想要自己实现一下这种效果,方法是在输出流中插入占位符\033[***. 我从网上收集了一些常用的控制语句,并用以下代码 ...

  5. 图解I/O模型

      本文带你鸟瞰I/O模型全貌,希望可以让你对I/O模型有一个直观的认识 什么是I/O?I/O的过程?同步阻塞 I/O同步非阻塞 I/OI/O多路复用异步I/O 什么是I/O?   I/O就是计算机内 ...

  6. django中间件 csrf auth认证

    django中间件 能做全局访问频率限制,身份校验,黑名单,白名单 用法: 新建一个文件夹,文件夹新建一个py文件,文件中写如下代码 注意点:你写的类必须继续MiddlewareMixin from ...

  7. Java导出Excel文件

    /** * 导出 用get请求 * @param response * @param * @throws IOException */ @RequestMapping(value = "/d ...

  8. NeurIPS审稿引发吐槽大会,落选者把荒唐意见怼了个遍:“我谢谢你们了”

    七月份的尾巴,机器学习顶会NeurIPS 2019的初步结果已经来了. 一年一度的吐槽盛会也由此开始. "有评审问我啥是ResNet." "有评审问我为啥没引用X论文.我 ...

  9. 热点 | 近期Github热点项目库总结

    整理 | Walker 介绍:你有没有想过你会成为一个艺术家,但无奈你不知道如何画画?得益于计算机视觉技术,你可以在ML社区轻松实现这个梦想.更棒的是,Github上ML社区的代码都是开源的! 这就是 ...

  10. LightOJ - 1341 Aladdin and the Flying Carpet 唯一分解定理LightOJ 1220Mysterious Bacteria

    题意: ttt 组数据,第一个给定飞毯的面积为 sss,第二个是毯子的最短的边的长度大于等于这个数,毯子是矩形但不是正方形. 思路: 求出 sss 的所有因子,因为不可能是矩形,所以可以除以 222, ...