此博客仅作为交流学习

对于使用bilibili上学习和娱乐的小伙伴们有时会看到视频博主发布的视频封面好看想要得到，但是苦于没有方法，这次我用python来爬取bilibili每周必看页面视频图片。

首先分析页面：

如上图所示，当我们想要在页面爬取图片时，往往得不到页面图片的地址，这时我们也得不到图片

开始抓包分析：

点击Network，CTRL+R开始抓包点击下面页面

发现页面是json

那么，只要进入当前页面解析并提取页面信息便可以拿到图片地址，进而得到视频封面了

import requests

import pprint

url = 'https://api.bilibili.com/x/web-interface/popular/series/one?number=168' #抓包网页

response = requests.get(url=url)

data = response.json()

pprint.pprint(data)  #将页面内容规范为易懂可视页面

分析页面：

解析并保存：

card = data['data']['list']

#print(card)

for card in card:

    pic = card.get('pic',None)  #图片地址获取

    title = card.get('title',None)

    print([pic,title])

    imgname = pic.split('/')[-1]

    img = requests.get(pic)

    with open(imgname, 'wb') as file:

        file.write(img.content)

    print(imgname)

效果：

完整代码：

import requests

import pprint

url = 'https://api.bilibili.com/x/web-interface/popular/series/one?number=168'

response = requests.get(url=url)

data = response.json()

#pprint.pprint(data)  #将页面内容规范为易懂可视页面

card = data['data']['list']

#print(card)

for card in card:

    pic = card.get('pic',None)  #图片地址获取

    title = card.get('title',None)

    print([pic,title])

    imgname = pic.split('/')[-1]

    img = requests.get(pic)

    with open(imgname, 'wb') as file:

        file.write(img.content)

    print(imgname)

【python爬虫】bilibili每周必看页面视频图片爬取的更多相关文章

Python爬虫入门教程 26-100 知乎文章图片爬取器之二
1. 知乎文章图片爬取器之二博客背景昨天写了知乎文章图片爬取器的一部分代码,针对知乎问题的答案json进行了数据抓取,博客中出现了部分写死的内容,今天把那部分信息调整完毕,并且将图片下载完善到代码中 ...
Python爬虫入门教程 25-100 知乎文章图片爬取器之一
1. 知乎文章图片写在前面今天开始尝试爬取一下知乎,看一下这个网站都有什么好玩的内容可以爬取到,可能断断续续会写几篇文章,今天首先爬取最简单的,单一文章的所有回答,爬取这个没有什么难度. 找到我们要 ...
Python爬虫实战（一）使用urllib库爬取拉勾网数据
本笔记写于2020年2月4日.Python版本为3.7.4,编辑器是VS code 主要参考资料有: B站视频av44518113 Python官方文档 PS:如果笔记中有任何错误,欢迎在评论中指出, ...
小白学 Python 爬虫（16）：urllib 实战之爬取妹子图
人生苦短,我用 Python 前文传送门: 小白学 Python 爬虫(1):开篇小白学 Python 爬虫(2):前置准备(一)基本类库的安装小白学 Python 爬虫(3):前置准备(二)Li ...
Python爬虫入门教程 12-100 半次元COS图爬取
半次元COS图爬取-写在前面今天在浏览网站的时候,忽然一个莫名的链接指引着我跳转到了半次元网站 https://bcy.net/ 打开之后,发现也没有什么有意思的内容,职业的敏感让我瞬间联想到了 c ...
Python爬虫入门教程 3-100 美空网数据爬取
美空网数据----简介从今天开始,我们尝试用2篇博客的内容量,搞定一个网站叫做"美空网"网址为:http://www.moko.cc/, 这个网站我分析了一下,我们要爬取的图片在 ...
Python 爬虫入门（三）—— 寻找合适的爬取策略
写爬虫之前,首先要明确爬取的数据.然后,思考从哪些地方可以获取这些数据.下面以一个实际案例来说明,怎么寻找一个好的爬虫策略.(代码仅供学习交流,切勿用作商业或其他有害行为) 1).方式一:直接爬取网站 ...
Python爬虫入门教程： All IT eBooks多线程爬取
All IT eBooks多线程爬取-写在前面对一个爬虫爱好者来说,或多或少都有这么一点点的收集癖 ~ 发现好的图片,发现好的书籍,发现各种能存放在电脑上的东西,都喜欢把它批量的爬取下来. 然后放着 ...
Python爬虫入门教程：半次元COS图爬取
半次元COS图爬取-写在前面今天在浏览网站的时候,忽然一个莫名的链接指引着我跳转到了半次元网站 https://bcy.net/ 打开之后,发现也没有什么有意思的内容,职业的敏感让我瞬间联想到了 c ...
python爬虫24 | 搞事情了，用 Appium 爬取你的微信朋友圈。
昨天小帅b看到一些事情不顺眼有人偷换概念忍不住就写了一篇反讽 996 的看不下去了,我支持996,年轻人就该996! 没想到有些人看不懂这就算了还来骂我早些时候关注我的小伙伴应该知道我第一 ...

随机推荐

loadrunner之录制脚本
LoadRunner是一款性能测试软件,通过模拟真实的用户行为,通过负载.并发和性能实时监控以及完成后的测试报告,分析系统可能存在的瓶颈,LoadRunner最为有效的手段之一应该就是并发控制,通过在 ...
TCP idle timeout 和TCP Keepalive 比较和分析
TCP idle timeout 和TCP Keepalive 是两个独立的功能. TCP idle timeout TCP idle timeout 是系统TCP配置文件中的空闲超时设 ...
python之tk学习，闲鱼搜索-小记
(如想转载,请联系博主或贴上本博地址) 编程,逻辑,总是让人如痴如醉. 下面进入正题. 火热的天气配上火热的python,python的入门友好性让门外汉们都看到了希望.当然自己写的程序如果没有GUI ...
修改/编辑jar包
替换或者导入jar包时,jar包被自动压缩,springboot规定嵌套的jar包不能在被压缩的情况下存储. 解决(本文以升级ojdbc包为例): 使用jar命令解压jar包,在压缩包外重新替换jar ...
HGD2-LSP选择集专题-网络整理
[Visual Lisp]图元选择集专题图元选择集专题 ;;★★★01.选择集操作★★★ (setq ss (ssadd));;创建一个空选择集 (ssadd (car(entsel)) ss);; ...
MarkDown学习day1
# Markdown学习 ## 标题: #+"空格"+标题名字为一级为标题 ##+"空格"+标题名字为二级标题同理几级标题就是几个#,最多支持6级标题 # ...
(转载)一篇文章详解python的字符编码问题
一篇文章详解python的字符编码问题一:什么是编码将明文转换为计算机可以识别的编码文本称为"编码".反之从计算机可识别的编码文本转回为明文为"解码". ...
classload加载机制
BootstrapClassLoader.ExtClassLoader.AppClassLoader实际是查阅相应的环境属性sun.boot.class.path.java.ext.dirs和java ...
30天帮你一步步学会Python的开源项目
最近发现一个不错的免费开源学习项目:30天学会Python 如果您最近有学习Python的打算,不妨看看这个是否适合你? 项目地址:https://github.com/Asabeneh/30-Day ...
python创建线程传参误区记录
创建线程可以使用threading模块中的Thread子类: 其中Thread子类允许的参数如下: (self, group=None, target=None, name=None, args=() ...

【python爬虫】bilibili每周必看页面视频图片爬取

此博客仅作为交流学习

【python爬虫】bilibili每周必看页面视频图片爬取的更多相关文章

随机推荐

热门专题