背景

前端时间在喜马拉雅上偶然听到牛大宝说的有声小说神通板砖,说的很是幽默,听的正起劲的时候开始收费了,于是我就在网上找了下看看有没有免费版,一搜果然有,但该网站上广告太多了,于是我就写了个小脚本可以批量下载的,供大家学习,如果您使用该脚本用于任何非法用途,均与本站无关

思路

  1. 找到可以免费下载资源网站
  2. 针对该网站html进行分析并编写下载脚本
  3. linux命令行自动顺序播放

实施

找到可以免费下载资源网站

网址: www.ting56.com/mp3/6475.html#liebiao

编写脚本 stbz.py

#!/usr/bin/env python3
# -*- coding: utf-8 -*- from html.parser import HTMLParser
import urllib3
import os http = urllib3.PoolManager()
baseUrl='http://www.ting56.com' class Mp3HTMLParser(HTMLParser):
def __init__(self):
HTMLParser.__init__(self) def handle_starttag(self,tag,attrs):
if tag == 'div':
for (k,v) in attrs:
if k=='id' and v=='bofangqi':
print(tag) class MyHTMLParser(HTMLParser): def __init__(self):
self.a_t = False
HTMLParser.__init__(self) def handle_starttag(self, tag, attrs):
"""
recognize start tag, like <div>
:param tag:
:param attrs:
:return:
"""
if tag == 'div':
for (k,v) in attrs:
if k == 'id' and v == 'vlink_1':
self.a_t = True
#print("Encountered a start tag:", tag)
else:
self.a_t = False
if self.a_t:
if tag == 'a':
title = ''
url = ''
for (k,v) in attrs:
if k=='href':
url=baseUrl+v
if k=='title':
title=v
#print('%s %s \n' % (title,url))
download(title,url)
#r = http.request('GET',url)
#dataStr = r.data.decode('gbk')
#parser = Mp3HTMLParser()
#parser.feed(dataStr) # def handle_endtag(self, tag):
# """
# recognize end tag, like </div>
# :param tag:
# :return:
# """
# print("Encountered an end tag :", tag)
#
def handle_data(self, data):
"""
recognize data, html content string
:param data:
:return:
"""
pass
#if self.a_t:
#print(data)
#
# def handle_startendtag(self, tag, attrs):
# """
# recognize tag that without endtag, like <img />
# :param tag:
# :param attrs:
# :return:
# """
# print("Encountered startendtag :", tag)
#
# def handle_comment(self,data):
# """
#
# :param data:
# :return:
# """
# print("Encountered comment :", data) def fromCharCode(n):
return chr(n%256) def download(name,url):
print('%s%s' % (name,url))
cmd = 'echo "%s%s" >> /tmp/stbz/downloadList.txt' % (name,url)
os.system(cmd) try:
if int(name) <= 137:
return
r = http.request('GET',url)
dataStr = r.data.decode('gbk')
os.environ['htmlStr'] = dataStr
cmd = 'echo $htmlStr | sed "s/.*FonHen_JieMa(\([0-9\\\'\*]*\)).*/\\1/g"'
t = os.popen(cmd).read()
t = t[1:-2]
#print(t)
tArr = t.split('*')
tmp = ''
for s in tArr:
if len(s)==0:
continue
tmp = tmp + fromCharCode(int(s))
print(tmp)
datas = tmp.split('&')
print(datas)
cmd = 'curl %s --output /tmp/stbz/%s.%s' % (datas[0],name,datas[2])
if os.system(cmd) != 0:
raise Exception("download err")
except:
print('[err] %s%s ' % (name,url))
cmd = 'echo "%s%s" >> /tmp/stbz/err.txt' % (name,url)
os.system(cmd) if __name__ == "__main__":
os.system('echo "" > /tmp/stbz/downloadList.txt')
r = http.request('GET','http://www.ting56.com/mp3/6475.html#liebiao')
dataStr = r.data.decode('gbk')
#print(dataStr)
parser = MyHTMLParser()
parser.feed(dataStr)

自动播放脚本

下载好的音频文件都是以数字编号的,所以可以播放完一个自动进行下一个,并且记录当前播放记录,方便下次继续播放 将下面的脚本保存为play.sh

#!/usr/bin/env bash

basepath=$(cd `dirname $0`;pwd)
cd $basepath
echo "workspace [$basepath]" posfile="stbz.pos" if [ ! -f "$posfile" ]; then
echo '1.m4a' > ${posfile}
fi pos=$(cat ${posfile})
state="start" for name in `cat ./stbz.lst`;do
if [ $state = "start" ]; then
if [ $pos = $name ]; then
echo "begin play ${pos}"
mplayer $name 1>> /dev/null 2>>err.txt || exit 1
state="play"
echo "${name}" > ${posfile}
fi
else
echo "begin play ${name}"
echo "${name}" > ${posfile}
mplayer $name 1>> /dev/null 2>>err.txt || exit 1
fi
done


原文来自 https://www.h3blog.com/article/python-download-stbz/

python下载神通板砖有声版的更多相关文章

  1. python下载想听的有声书,让喜马拉雅收费,我是程序员!

    from urllib import parse,request import urllib header_dict = {'User-Agent': 'Mozilla/5.0 (Windows NT ...

  2. Python学习手册(第4版) - 专业程序员的养成完整版PDF免费下载_百度云盘

    Python学习手册(第4版) - 专业程序员的养成完整版PDF免费下载_百度云盘 提取码:g7v1 作者简介 作为全球Python培训界的领军人物,<Python学习手册:第4版>作者M ...

  3. Python基础教程(第3版)PDF高清完整版免费下载|百度云盘

    百度云盘:Python基础教程(第3版)PDF高清完整版免费下载 提取码:gkiy 内容简介 本书包括Python程序设计的方方面面:首先从Python的安装开始,随后介绍了Python的基础知识和基 ...

  4. Python学习手册(第4版)PDF高清完整版免费下载|百度云盘

    Python学习手册(第4版)PDF高清完整版免费下载|百度云盘 提取码:z6il 内容简介 Google和YouTube由于Python的高可适应性.易于维护以及适合于快速开发而采用它.如果你想要编 ...

  5. Python编程入门(第3版)|百度网盘免费下载|零基础入门学习资料

    百度网盘免费下载:Python编程入门(第3版) 提取码:rsd7 目录  · · · · · · 第1章 编程简介 11.1 Python语言 21.2 Python适合用于做什么 31.3 程序员 ...

  6. Python核心编程(第3版)PDF高清晰完整中文版|网盘链接附提取码下载|

    一.书籍简介<Python核心编程(第3版)>是经典畅销图书<Python核心编程(第二版)>的全新升级版本.<Python核心编程(第3版)>总共分为3部分.第1 ...

  7. Python下载及Python最强大IDEPyCharm下载链接

    Python下载: https://www.python.org/downloads/ PyCharm下载: https://www.jetbrains.com/pycharm/download/#s ...

  8. 学习参考《Python基础教程(第3版)》中文PDF+英文PDF+源代码

    python基础教程ed3: 基础知识 列表和元组 字符串 字典 流程控制 抽象(参数 作用域 递归) 异常 魔术方法/特性/迭代器 模块/标准库 文件 GUI DB 网络编程 测试 扩展python ...

  9. Python环境搭建-3 Python下载

    python环境搭建 Python是一个跨平台.可移植的编程语言,因此可在windows.Linux和Mac OS X系统中安装使用. 安装完成后,你会得到Python解释器环境,可以通过终端输入py ...

随机推荐

  1. 实现TabControl 选项卡首个标签缩进的方法

    借用一张网图说明需求 在网上找了一圈,没有找到直接通过API或者重绘TabControl 的解决方法,最后灵机一动想到了一个折(tou)中(lan)的解决办法 Tab1.TabPages.Clear( ...

  2. sql server 重命名表名,字段名

    重命名表名: exec sp_rename 'oldName','newName'; 重命名字段名: exec sp_rename 'tableName.[oldName]','newName','c ...

  3. PAT甲级——1027 Colors in Mars

    1027 Colors in Mars People in Mars represent the colors in their computers in a similar way as the E ...

  4. vs2015的密钥

    最近一直提示VS要登陆,登陆完就说评估期已到,搞得很烦. VS2015 enterprise版本得密钥:  HM6NR-QXX7C-DFW2Y-8B82K-WTYJV    亲测有效!!! 专业版本的 ...

  5. [从 0 开始的 Angular 生活]No.38 实现一个 Angular Router 切换组件页面(一)

    前言 今天是进入公司的第三天,为了能尽快投入项目与成为团队可用的战力,我正在努力啃官方文档学习 Angular 的知识,所以这一篇文章主要是记录我如何阅读官方文档后,实现这个非常基本的.带导航的网页应 ...

  6. 吴裕雄--天生自然python学习笔记:python处理word文档

    Office 文件是我们日常工作生活中都经常用到的文件格 式,其中以 Word 格式的文件最为常用 . Python 可通过 Win32com 纽件对 Micro so位 Office 文件 进行存取 ...

  7. Qt Sleep、QCoreApplication::processEvents()(最佳的平衡:一边发送消息,一边睡眠)

    sleep()//秒 msleep()//毫秒 usleep()//微秒 以前为了模拟鼠标点击用过这些函数,可以让进程中断,今天发现我原来的做法其实不对.这组函数会将你当前的线程/进程变为“睡眠”状态 ...

  8. VSTO开发Excel 2013/2016工作簿项目

    范例下载:(下载后直接双击扩展名为.vsto的文件,或者双击扩展名为.xlsx的工作簿,按提示操作) ExcelWorkbook_Everything.rar

  9. Python面向对象三大特征

    继承 面向对象中的继承就是继承的类直接拥有被继承类的属性而不需要在自己的类体中重新再写一遍,其中被继承的类叫做父类.基类,继承的类叫做派生类.子类.在python3中如果不指定继承哪个类,默认就会继承 ...

  10. MOOC(7)- case依赖、读取json配置文件进行多个接口请求-模拟接口响应数据(18)

    这里是把传入的请求数据作为响应值返回 # -*- coding: utf-8 -*- # @Time : 2020/2/15 9:47 # @File : do_mock_18.py # @Autho ...