Python爬虫一爬取B站小视频源码

如果要爬取多页的话在最下方循环中填写好循环的次数就可以了

项目源码

 from fake_useragent import UserAgent

 import requests

 import time

 ua=UserAgent()

 def downloader(url, path):

     start = time.time()   # 开始时间

     size = 0

     headers = {

         'User-Agent':ua.random

     }

     response = requests.get(url, headers=headers, stream=True)   # stream 属性必须带上

     chunk_size = 1024    # 每次下载的数据大小

     content_size = int(response.headers['content-length'])   # 总大小

     if response.status_code == 200:

         print('[文件大小]:%0.2f MB' % (content_size / chunk_size / 1024))   # 换算单位

         with open(path, 'wb') as file:

             for data in response.iter_content(chunk_size=chunk_size):

                 file.write(data)

                 size += len(data)   # 已下载的文件大小

                 print('\r' + '[下载进度]:%s%.2f%%' % ('>' * int(size * 50 / content_size), float(size / content_size *

                                                                                              100)), end=" ")

     end = time.time()    # 结束时间

     print('\n' + '视频下载完成！用时%.2f秒' % (end - start))

 def The_URL(page):

     URL='http://api.vc.bilibili.com/board/v1/ranking/top?page_size=10&next_offset={}&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc'.format(page)

     headers={

         'User-Agent':ua.random

     }

     sponse=requests.get(URL,headers=headers).json()

     item=sponse.get('data').get('items')

     for i in item:

         ite=i.get('item')

         #视频标题

         Video_name=ite.get('description')

         #发布日期

         Release_time=ite.get('upload_time_text')

         #视频下载地址

         Video_download_link=ite.get('video_playurl')

         #视频作者

         The_name=i.get('user').get('name')

         try:

             print('当前下载的是:%s'%Video_name)

             downloader(Video_download_link,path='%s.mp4'%Video_name)

         except Exception as e:

             print(e.args)

 for i in range(0,100):

     i=i*10+1

     The_URL(i)

初学者对Python的概念模糊不清的，Python能做什么，学的时候该按照什么线路去学习，学完往哪方面发展，想深入了解，详情可以复制有道云笔记链接到浏览器打开了解：http://note.youdao.com/noteshare?id=e4fa02e7b56d7909a27674cdb3da08aa

学习视频资料、开发工具等都有免费分享，还有专业的老师答疑

Python爬虫一爬取B站小视频源码的更多相关文章

爬虫---爬取b站小视频
前面通过python爬虫爬取过图片,文字,今天我们一起爬取下b站的小视频,其实呢,测试过程中需要用到视频文件,找了几个网站下载,都需要会员什么的,直接写一篇爬虫爬取视频~~~ 分析b站小视频 1.进入 ...
from appium import webdriver 使用python爬虫,批量爬取抖音app视频（requests+Fiddler+appium）
使用python爬虫,批量爬取抖音app视频(requests+Fiddler+appium) - 北平吴彦祖 - 博客园 https://www.cnblogs.com/stevenshushu/p ...
使用python爬虫,批量爬取抖音app视频（requests+Fiddler+appium）
抖音很火,楼主使用python随机爬取抖音视频,并且无水印下载,人家都说天下没有爬不到的数据,so,楼主决定试试水,纯属技术爱好,分享给大家.. 1.楼主首先使用Fiddler4来抓取手机抖音app这 ...
Python爬虫之爬取站内所有图片
title date tags layut Python爬虫之爬取站内所有图片 2018-10-07 Python post 目标是 http://www.5442.com/meinv/ 如需在非li ...
[Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上)
转载自:http://blog.csdn.net/eastmount/article/details/51231852 一. 文章介绍源码下载地址:http://download.csdn.net/ ...
python爬虫实战---爬取大众点评评论
python爬虫实战—爬取大众点评评论(加密字体) 1.首先打开一个店铺找到评论很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手.很多已经 ...
Python爬虫之爬取淘女郎照片示例详解
这篇文章主要介绍了Python爬虫之爬取淘女郎照片示例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧本篇目标抓取淘宝MM ...
Python爬虫之爬取慕课网课程评分
BS是什么? BeautifulSoup是一个基于标签的文本解析工具.可以根据标签提取想要的内容,很适合处理html和xml这类语言文本.如果你希望了解更多关于BS的介绍和用法,请看Beautiful ...
scrapy进阶（CrawlSpider爬虫__爬取整站小说）
# -*- coding: utf-8 -*- import scrapy,re from scrapy.linkextractors import LinkExtractor from scrapy ...

随机推荐

入门项目数字手写体识别：使用Keras完成CNN模型搭建（重要）
摘要: 本文是通过Keras实现深度学习入门项目——数字手写体识别,整个流程介绍比较详细,适合初学者上手实践. 对于图像分类任务而言,卷积神经网络(CNN)是目前最优的网络结构,没有之一.在面部识别. ...
PTA的Python练习题（十）
从第3章-22 输出大写英文字母开始 1. a=str(input()) b='' for i in a: if 'A'<=i<='Z' and i not in b: b=b+i i ...
git 从创建到推送到远程，到拉取，实操
https://www.liaoxuefeng.com/wiki/896043488029600/900003767775424 初始化 git init 添加所有文件到暂存区 git add . c ...
玩转NB-IOT模块之sim7000c
https://blog.csdn.net/liwei16611/article/details/82698926 http://bbs.21ic.com/icview-2104630-1-1.htm ...
吴裕雄 Bootstrap 前端框架开发——Bootstrap 显示代码：同一行代码片段: span, div
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title> ...
Nginx解决服务器宕机问题
1.Nginx解决服务器宕机问题,Nginx配置服务器宕机策略,如果服务器宕机,会找下一台机器进行访问配置nginx.cfg配置文件,在映射拦截地址中加入代理地址响应方案 location / { ...
Kali中文乱码问题
上面的是用网上介绍的安装组件无法安装,老是提示最后一句:Unable to locate package ...... 后来觉得应该是因为安装Kali时在最后有个选择更新系统的一个配置上,我选择了下面 ...
spring boot 中容器 Jetty、Tomcat、Undertow
spring boot 中依赖tomcat <dependency> <groupId>org.springframework.boot</groupId> < ...
postman 使用post方式提交参数值
参考:https://www.cnblogs.com/haoxuanchen2014/p/7771459.html
Python数据类型-6 字典
字典 Python的字典数据类型是基于hash散列算法实现的,采用键值对(key:value)的形式,根据key的值计算value的地址,具有非常快的查取和插入速度.但它是无序的,包含的元素个数不限, ...

Python爬虫一爬取B站小视频源码

Python爬虫一爬取B站小视频源码的更多相关文章

随机推荐

热门专题