使用requests+BeautifulSoup爬取龙族V小说

这几天想看龙族最新版本，但是搜索半天发现没有网站提供下载，我又只想下载后离线阅读（写代码已经很费眼睛了）。无奈只有自己爬取了。

这里记录一下，以后想看时，直接运行脚本下载小说。

这里是从 http://longzu5.co 这个网站下载的小说，如果需要更改存储路径，可以更改 FILE_URL 常量的值

如果爬取不到了，说明，此网站做了防爬虫，或者其渲染网页的 html 元素改变了。

# -*- coding: utf-8 -*-

# (C) rgc, 2018

# All rights reserved

# requirements list: [python3.6, requests, bs4]

import requests

from bs4 import BeautifulSoup

URL = "http://longzu5.co"

FILE_URL = 'E:\lz.txt'

def get_son_text(strs):

    # 获取文章内容

    soup = BeautifulSoup(strs, 'html.parser')

    body_soup = soup.find('div', 'post-body')

    result = body_soup.find_all('p')

    title = soup.find('h2', 'post-title')

    title = title.text

    final_txt = title + '\n'

    for item in result:

        txt = item.text

        final_txt += txt

    final_txt += '\n\n'

    with open(FILE_URL, 'a', encoding='utf-8') as f:

        f.write(final_txt)

def get_father_text():

    """

    获取文章列表

    :return:

    """

    res = requests.get(URL + "/")

    strs = res.text

    soup = BeautifulSoup(strs, 'html.parser')

    ul_soup = soup.find('ul', 'booklist')

    x = ul_soup.find_all('a')

    section_list = []

    for item in x:

        url = URL + item.get('href')

        section_list.append(url)

    section_list.reverse()

    for url in section_list:

        print(url)

        section = requests.get(url)

        sec_txt = section.text

        get_son_text(sec_txt)

if __name__ == '__main__':

    get_father_text()

# 如有版权，请及时联系我，我会及时删除，如有冒犯，请原谅。

使用requests+BeautifulSoup爬取龙族V小说的更多相关文章

爬虫入门实例：利用requests库爬取笔趣小说网
w3cschool上的来练练手,爬取笔趣看小说http://www.biqukan.com/, 爬取<凡人修仙传仙界篇>的所有章节 1.利用requests访问目标网址,使用了get方法 ...
python3 requests + BeautifulSoup 爬取阳光网投诉贴详情实例代码
用到了requests.BeautifulSoup.urllib等,具体代码如下. # -*- coding: utf-8 -*- """ Created on Sat ...
python 爬虫 requests+BeautifulSoup 爬取巨潮资讯公司概况代码实例
第一次写一个算是比较完整的爬虫,自我感觉极差啊,代码low,效率差,也没有保存到本地文件或者数据库,强行使用了一波多线程导致数据顺序发生了变化... 贴在这里,引以为戒吧. # -*- coding: ...
requests+BeautifulSoup | 爬取电影天堂全站电影资源
import requests import urllib.request as ur from bs4 import BeautifulSoup import csv import threadin ...
Python爬虫学习三------requests+BeautifulSoup爬取简单网页
第一次第一次用MarkDown来写博客,先试试效果吧! 昨天2018俄罗斯世界杯拉开了大幕,作为一个伪球迷,当然也得为世界杯做出一点贡献啦. 于是今天就编写了一个爬虫程序将腾讯新闻下世界杯专题的相关新 ...
python 爬虫（一） requests+BeautifulSoup 爬取简单网页代码示例
以前搞偷偷摸摸的事,不对,是搞爬虫都是用urllib,不过真的是很麻烦,下面就使用requests + BeautifulSoup 爬爬简单的网页. 详细介绍都在代码中注释了,大家可以参阅. # -* ...
requests+beautifulsoup爬取豆瓣图书
使用Xpath和BeautifulSoup来解析网页可以说真的很简便. import requests from bs4 import BeautifulSoup from random import ...
Python使用urllib,urllib3,requests库+beautifulsoup爬取网页
Python使用urllib/urllib3/requests库+beautifulsoup爬取网页 urllib urllib3 requests 笔者在爬取时遇到的问题 1.结果不全 2.'抓取失 ...
[实战演练]python3使用requests模块爬取页面内容
本文摘要: 1.安装pip 2.安装requests模块 3.安装beautifulsoup4 4.requests模块浅析 + 发送请求 + 传递URL参数 + 响应内容 + 获取网页编码 + 获取 ...

随机推荐

脚手架方式搭建vue项目
一.首先基于node环境,我想应该每一个前端开发者都应该懂的吧,这里安装运行什么的就不多说了. 搭建成功之后在文件夹的任何(如果是全局的话)一个位置都能按住shift键同时鼠标右键在工具框中就会出来一 ...
Swift中enum, struct, class的有关使用方法
import Foundation print("Hello, World!") let a = var b = var c = a + b; c = //重载:函数名相同, 函数 ...
HTTPS和HTTP（加密知识）
什么是HTTPS? 基于安全套接字层的超文本传输协议(HTTP over SSL),一个Netscape开发的Web协议.HTTPS在HTTP应用层的基础上使用安全套接字层(或者升级版传输层安全,Tr ...
javascript中使用"<"符号,比较大小的是字符串或对象时正确的处理方法
<![CDATA[ var items=document.getElementsByTagName("li"); for(var i=0;i<items.length; ...
20164318 毛瀚逸 Exp3 免杀原理与实践
1实验要求 1.1 正确使用msf编码器(0.5分),msfvenom生成如jar之类的其他文件(0.5分),veil-evasion(0.5分),加壳工具(0.5分),使用shellcode编程(1 ...
bugku 密码学一些题的wp
---恢复内容开始--- 1.滴答滴摩斯密码,http://tool.bugku.com/mosi/ 2.聪明的小羊从提示猜是栅栏密码,http://tool.bugku.com/jiemi/ 3 ...
js处理数字加后缀w
num > 9999 ? (Math.floor(num/1000)/10) + 'w' : num
详解：idea工具下的main函数只执行Thread.activeCount()，打印值为：2
写多线程的时候,想要等main中其他线程都执行完成后(其他线程功能为对一个数字inc+1),输出最终的inc值. 于是写了个循环: while (Thread.activeCount() > 1 ...
Taskctl安装及配置Kettle插件
服务端安装从官网下载服务端安装包(含字符客户端/代理组件) 1.环境变量设置在fedora的终端下,输入sudo vi /etc/profile,将以下语句添加至文末 export TASKCTL ...
flagr 数据库配置
flagr 是一个很不错的特性开关.a/b 测试服务,默认使用的是sqlite 数据库,但是我们可以通过配置,使用不同的数据库 sqlite.mysql.postrgresql.json_file.j ...

使用requests+BeautifulSoup爬取龙族V小说

使用requests+BeautifulSoup爬取龙族V小说的更多相关文章

随机推荐

热门专题