生成有声小说原理

文字是1500字内的生成微软文档说说

用代码实现小说爬取正本

实现每章小说1450字

实现自动剪切后添加封面

实现自动上传

用python代码实现爬取小说，本案列以一本小说为实列代码

点击查看代码

from bs4 import BeautifulSoup

import requests, sys

"""

类说明:下载《笔趣看》网小说《一念永恒》

Parameters:

    无

Returns:

    无

Modify:

"""

class downloader(object):

    def __init__(self):

        self.server = 'http://www.biqukan.com/'

        self.target = 'http://www.biqukan.com/1_1094/'

        self.headers = {

            "User_Agent": "User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36", }

        self.names = []  # 存放章节名

        self.urls = []  # 存放章节链接

        self.nums = 0  # 章节数

    """

    函数说明:获取下载链接

    Parameters:

        无

    Returns:

        无

    Modify:

    """

    def get_download_url(self):

        req = requests.get(url=self.target, headers=self.headers)

        html = req.content.decode("gbk")

        div_bf = BeautifulSoup(html, features="lxml")

        div = div_bf.find_all('div', class_='listmain')

        a_bf = BeautifulSoup(str(div[0]), features="lxml")

        a = a_bf.find_all('a')

        self.nums = len(a[15:])  # 剔除不必要的章节，并统计章节数

        for each in a[15:]:

            self.names.append(each.string)

            self.urls.append(self.server + each.get('href'))

    """

    函数说明:获取章节内容

    Parameters:

        target - 下载连接(string)

    Returns:

        texts - 章节内容(string)

    Modify:

    """

    def get_contents(self, target):

        req = requests.get(url=target, headers=self.headers)

        html = req.content.decode("gbk")

        bf = BeautifulSoup(html, features="lxml")

        texts = bf.find_all('div', class_='showtxt')

        texts = texts[0].text.replace('\xa0' * 8, '\n\n')

        return texts

    """

    函数说明:将爬取的文章内容写入文件

    Parameters:

        name - 章节名称(string)

        path - 当前路径下,小说保存名称(string)

        text - 章节内容(string)

    Returns:

        无

    Modify

    """

    def writer(self, name, path, text):

        write_flag = True

        with open(path, 'a', encoding='utf-8') as f:

            f.write(name + '\n')

            f.writelines(text)

            f.write('\n\n')

if __name__ == "__main__":

    dl = downloader()

    dl.get_download_url()

    print('《一年永恒》开始下载：')

    for i in range(dl.nums):

        dl.writer(dl.names[i], '一念永恒.txt', dl.get_contents(dl.urls[i]))

        sys.stdout.write("  已下载:%.3f%%" % float(i / dl.nums) + '\r')

        sys.stdout.flush()

    print('《一年永恒》下载完成')

##本文爬取小说因为是单进程，所以下载速度比较忙
##仅供学习参考

python生成有声小说模拟真人发音的更多相关文章

小说光看还不够？用Python做有声小说！
文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http:// ...
Python模块---制作属于自己的有声小说
操作环境 Python版本: anaconda3 python3.7.4 操作系统: Ubuntu19.10 编译器: pycharm社区版用到的模块: pyttsx3,requests pysst ...
Python实战：下载鬼灵报告有声小说
在家无聊,想看看小说,不过看的眼睛痛,就想着下个有声小说来听听.但风上找到的都是要一集一集下,还得重命名,122集啊,点到什么时候. 写个批处理下载的脚本.记录下过程. 一.老套路了,找到下载URL. ...
python爬虫之小说网站--下载小说(正则表达式)
python爬虫之小说网站--下载小说(正则表达式) 思路: 1.找到要下载的小说首页,打开网页源代码进行分析(例:https://www.kanunu8.com/files/old/2011/244 ...
2019-04-23-Python爬取有声小说
目录 Python爬取有声小说摘要 1.获取下载链接 2.分析规律,循环爬取 3.保存到本地,批量命名 4.界面设计 5.效果展示 Python爬取有声小说通过python爬取网站的资源,实现批量 ...
JavaScript 解析 Django Python 生成的 datetime 数据时区问题解决
JavaScript 解析 Django/Python 生成的 datetime 数据当Web后台使用Django时,后台生成的时间数据类型就是Python类型的. 项目需要将几个时间存储到数据库中 ...
【python】【转】Python生成随机数的方法
如果你对在Python生成随机数与random模块中最常用的几个函数的关系与不懂之处,下面的文章就是对Python生成随机数与random模块中最常用的几个函数的关系,希望你会有所收获,以下就是这篇文 ...
Python生成随机数的方法
这篇文章主要介绍了Python生成随机数的方法,有需要的朋友可以参考一下如果你对在Python生成随机数与random模块中最常用的几个函数的关系与不懂之处,下面的文章就是对Python生成随机数与 ...
Python 生成的页面中文乱码问题
第一保证程序源文件里的中文的编码格式,如我们把源文件的编码设置成utf8的. reload(sys) sys.setdefaultencoding('utf-8') 第二, 告诉浏览器,我们须要 ...

随机推荐

DS博客作业04--图
这个作业属于哪个班级数据结构--网络2011/2012 这个作业的地址 DS博客作业04--图这个作业的目标学习图结构设计及相关算法姓名黄静目录 0.PTA得分截图 1.本周学习总结 1. ...
Java基础系列（16）- Scanner进阶使用
了解更多的sanner方法 Ctrl+鼠标左键,点击[Scanner] 点击Structure 看到了Scanner类下面的所有方法,以及具体方法实现的底层封装逻辑拓展例子_nextInt()获取和 ...
Java面向对象系列（14）- 接口的定义与实现
接口普通类:只有具体实现抽象类:具体实现和规范(抽象方法)都有接口:只有规范!约束和实现分离接口就是规范,定义的是一组规则,体现了现实世界中"如果你是-则必须能-"的思想. ...
golang 开发环境配置 go语言 liteIDE
Mac: * 下载go安装包 go语言中文网 ** 通过源码编译安装需要先安装go1.4 wget https://studygolang.com/dl/golang/go1.10.3.src.tar ...
pycharm向GitHub提交代码
设置为自动add commit代码 push代码查看github,看到提交记录
鸿蒙内核源码分析(系统调用篇) | 开发者永远的口头禅 | 百篇博客分析OpenHarmony源码 | v37.03
百篇博客系列篇.本篇为: v37.xx 鸿蒙内核源码分析(系统调用篇) | 开发者永远的口头禅 | 51.c.h .o 任务管理相关篇为: v03.xx 鸿蒙内核源码分析(时钟任务篇) | 触发调度谁 ...
YbtOJ#832-鸽子饲养【凸包,Floyd】
正题题目链接:https://www.ybtoj.com.cn/contest/116/problem/3 题目大意给出两个大小分别为\(n,m\)的点集\(A,B\). 求出\(B\)的一个最小 ...
CF803G-Periodic RMQ Problem【离散化,线段树,ST表】
正题题目链接:https://www.luogu.com.cn/problem/CF803G 题目大意一个长度为\(n\)的序列\(a\)复制\(k\)份连接,要求支持区间赋值区间查询最小值 ...
unittest基本原理及介绍
unittest基本原理: unittest是python自带的测试框架,还有一个框架是:pytest,这里简单介绍下unittest模块的简单应用 unittest是python的标准测试库,相比于 ...
树莓派3B上手一二
树莓派3B上手一二早些时间心血来潮买过一个树莓派,但是当时只是玩一玩,买来按照网上的教程摆弄了一下就闲置了.最近毕业设计,做时序数据分析的相关的工作,刚好想起能够用到树莓派+Node-RED来生成模 ...

python生成有声小说模拟真人发音

生成有声小说原理

文字是1500字内的生成微软文档说说

用代码实现小说爬取正本

实现每章小说1450字

实现自动剪切后添加封面

实现自动上传

用python代码实现爬取小说，本案列以一本小说为实列代码

python生成有声小说模拟真人发音的更多相关文章

随机推荐

热门专题