python爬视频实例

例：抓取PhotoShop视频教程网址http://www.mxiaobei.com/?id=424

import requests

import re

from bs4 import BeautifulSoup

import time

dicts = {}

list1 = set()

print('start')

ua = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36'

urls = 'http://www.mxiaobei.com/?id='

for index in range(451, 565):

    r = requests.get(urls + str(index), headers = {'user-agent': ua })

    r.encoding = 'utf-8'

    soup = BeautifulSoup(r.text, 'lxml')

    title = soup.find(name='h2')

    mp4url = soup.find('div', id='CuPlayer')

    if mp4url is None:

        list1.add(index)

        continue

    mpurl = re.search('http.*?mp4', mp4url.text)

    dicts[title.text] = mpurl.group()

    #print(index)

    #time.sleep(1)

    #print(title.text + ' : ' + dicts[title.text])

print(dicts)

print(list1)

for temp in dicts.items():

    #time.sleep(1)

    r = requests.get(temp[1], stream=True)

    with open(temp[0] + '.mp4', "wb") as mp4:

        for chunk in r.iter_content(chunk_size=1024 * 1024):

            if chunk:

                mp4.write(chunk)

    print(temp[0]+'下载完成')

print('end!')

BeautifulSoup: https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/
Requests: http://cn.python-requests.org/zh_CN/latest/

python爬视频实例的更多相关文章

没有内涵段子可以刷了，利用Python爬取段友之家贴吧图片和小视频(含源码)
由于最新的视频整顿风波,内涵段子APP被迫关闭,广大段友无家可归,但是最近发现了一个"段友"的app,版本更新也挺快,正在号召广大段友回家,如下图,有兴趣的可以下载看看(ps:我不 ...
Python爬虫教程-17-ajax爬取实例（豆瓣电影）
Python爬虫教程-17-ajax爬取实例(豆瓣电影) ajax: 简单的说,就是一段js代码,通过这段代码,可以让页面发送异步的请求,或者向服务器发送一个东西,即和服务器进行交互对于ajax: ...
Python爬取视频指南
摘自:https://www.jianshu.com/p/9ca86becd86d 前言前两天尔羽说让我爬一下菜鸟窝的教程视频,这次就跟大家来说说Python爬取视频的经验正文 https://w ...
用Python爬取B站、腾讯视频、爱奇艺和芒果TV视频弹幕！
众所周知,弹幕,即在网络上观看视频时弹出的评论性字幕.不知道大家看视频的时候会不会点开弹幕,于我而言,弹幕是视频内容的良好补充,是一个组织良好的评论序列.通过分析弹幕,我们可以快速洞察广大观众对于视频 ...
教你用python爬取抖音app视频
记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitmproxy app自动化工具:appium 运行环境:windows10 思 ...
【Python爬虫案例】用Python爬取李子柒B站视频数据
一.视频数据结果今天是2021.12.7号,前几天用python爬取了李子柒的油管评论并做了数据分析,可移步至: https://www.cnblogs.com/mashukui/p/1622025 ...
python爬取youtube视频多线程非中文自动翻译
声明:我写的所有文章都是发在博客园的,我看到其他复制粘贴过去的连个出处也不写,直接打上自己的水印...真是没的说了. 前言:前段时间搞了一些爬视频的项目,代码都写好了,这里写文章那就在来重新分析一遍 ...
Python爬取51job实例
用Python爬取51job里面python相关职业.工作地址和薪资. 51job上的信息程序代码 from bs4 import BeautifulSoup from urllib.request ...
萌新学习Python爬取B站弹幕+R语言分词demo说明
代码地址如下:http://www.demodashi.com/demo/11578.html 一.写在前面之前在简书首页看到了Python爬虫的介绍,于是就想着爬取B站弹幕并绘制词云,因此有了这样 ...

随机推荐

windows开机执行bat
一.以windows下备份sql数据库为例,开机自动执行.bat脚本 1.新建dump.bat文件,文件中的代码如下: set YYYYmmdd=%date ...
python 设计模式之模板方法模式
1.模板方法模式定义模板模式定义如下:定义一个操作中的算法的框架,而将一些步骤延迟到子类中,使得子类可以不改变一个算法的结构即可重新定义该算法的某些特定的步骤.子类实现的具体方法叫作基本方法,实现对 ...
vue + elementui form resetFields方法无法重置表单
this.$refs['form'].resetFields(); 方法无法重置.1 el-form 组件没有添加 ref 属性 <el-form ref="form" : ...
Mac使用brew安装nginx，并解决端口80访问权限问题
1.安装 brew install nginx 2.修改配置文件 sudo vi /usr/local/etc/nginx/nginx.conf 修改默认的8080端口为80 修改日志文件地方 err ...
ISO/IEC 9899:2011 条款5——5.1.1 翻译环境
5.1.1 翻译环境 5.1.1.1程序结构 1.一个C程序不需要一次全被翻译完.程序的文本被保存在本国际标准中被称作为源文件(或预处理文件)的单元里.一个源文件连同所有通过指示符#include所包 ...
深入理解DefaultMessageListenerContainer
DefaultMessageListenerContainer是一个用于异步消息监听的管理类. DefaultMessageListenerContainer最简单的实现逻辑,一个任务执行器,执行任务 ...
自己发挥的内容有关ViewModel的一句翻译（难点expecting）
Qt编写自定义控件48-面板窗体控件
一.前言很多时候需要有一个控件,能够替代容器控件,自动容纳多个widget,自适应宽高,然后提供滚动条功能,这就必然需要用到QScrollArea控件,可设置各个子面板的间距等,也在很多系统中用到, ...
web框架之MVC/MTV
MVC框架 MVC 是一种使用 MVC(Model View Controller 模型-视图-控制器)设计创建 Web 应用程序的模式 Model(模型)表示应用程序核心(比如数据库记录列表) Vi ...
HTML、CSS之查遗补漏
inline-block3个额外像素宽度问题先看下例子: Title .sp{ /*border: 1px solid lightcoral;*/ display: inline-block; he ...

python爬视频实例

python爬视频实例的更多相关文章

随机推荐

热门专题