Python学习-使用Python爬取陈奕迅新歌《我们》网易云热门评论

《后来的我们》上映也有好几天了，一直没有去看，前几天还爆出退票的事件，电影的主题曲由陈奕迅所唱，特地找了主题曲《我们》的MV看了一遍，还是那个感觉。那天偶然间看到Python中文社区公众号推送了一篇文章《用Python爬取陈奕迅新歌《我们》10万条评论的新发现》。最近一直在学习Python，想着找一个有趣的项目做一个练习，于是就模仿作者的代码开始练习，原文中作者在题目中说是“10万条评论的新发现”，通过程序运行，发现作者并没有对所有评论进行爬取，只是爬取了网易云音乐中《我们》这首歌的热门评论，并根据数据绘制了图表。

网易云《我们》

代码：

 #!/usr/bin/env python3

 # -*- coding: utf-8 -*-

 # @Time    : 2018/4/29 18:09

 # @Author  : yang

 # @File    : Code.py

 # @Software: PyCharm

 import requests

 import json

 #爬取陈奕迅的《我们》的热门评论

 #参数：url,headers,user_data(params,encSecKey)

 url = 'http://music.163.com/weapi/v1/resource/comments/R_SO_4_551816010?csrf_token='    #评论所在的链接

 headers = {

     'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36',

     'Referer':'http://music.163.com/song?id=551816010',

     'Origin':'http://music.163.com',

     'Host':'music.163.com'

 }

 #加密数据，直接拿过来用

 user_data = {

     'params':'60e75d03+rb9U8IQhy6/9+H1si5pp7qLysZoQsYG9qFkXtXL9dRKMfchCKpJ8OpN9m7vSRVkYWN+wscyUqelunqxGDozt2bJWQ2QRj4pJrSa0xoJPAk5Jw8t70rYW8hwdyoYswl+kRQTQ6oz3eHHZ5BLzZZB4t/4asFSQQDnCteg2GqrEJBomMgpFMIa4Ybt',

     'encSecKey':'52db8824c86503bc2cfc050ac78969c9155ff08f274f88b767ad6535febcbad021d0cdabcc172e01f91c42a2aca0786e407935f8feaa44a03efb96ec9d71de181e92ae8471738e4a43b252f22b46739cb3b86544a9f9403b0402bd9638a3bc2b87bf3a0b9cff6ef7b6b1589f00a5bfeecb9d45c493456082d80fbece6ac5a3fa'

 }

 response = requests.post(url,headers=headers,data=user_data)

 data = json.loads(response.text)

 hotcomments = []

 for hotcomment in data['hotComments']:

     item = {

         'nickname':hotcomment['user']['nickname'],

         'content':hotcomment['content'],

         'likedCount':hotcomment['likedCount']

     }

     hotcomments.append(item)

 #获取评论用户名，内容，以及对应的获赞数

 content_list = [content['content'] for content in hotcomments]

 nickname = [content['nickname'] for content in hotcomments]

 liked_count = [content['likedCount'] for content in hotcomments]

 #点赞数

 from pyecharts import Bar      #pyecharts：图表包

 bar = Bar('热门中点赞数示例图')

 bar.add('点赞数',nickname,liked_count,is_stack=True,mark_line=['min','max'],mark_point=['average'])

 bar.render()

 #词云图

 from wordcloud import WordCloud     #WordCloud：词云包

 import matplotlib.pyplot as plt     #matplotlib：绘图功能包

 content_text = ' '.join(content_list)

 wordcloud = WordCloud(font_path=r'C:\simhei.ttf',max_words=200).generate(content_text)

 plt.figure()

 plt.imshow(wordcloud,interpolation='bilinear')

 plt.axis('off')

 plt.show()

爬取结果：

热门评论中点赞数示意图：

热门评论词云图：

Python学习-使用Python爬取陈奕迅新歌《我们》网易云热门评论的更多相关文章

python学习--第二天爬取王者荣耀英雄皮肤
今天目的是爬取所有英雄皮肤在爬取所有之前,先完成一张皮肤的爬取打开anacond调出编译器Jupyter Notebook 打开王者荣耀官网下拉找到位于网页右边的英雄/皮肤点击[+更多] 进入 ...
Python学习 —— 爬虫入门 - 爬取Pixiv每日排行中的图片
更新于 2019-01-30 16:30:55 我另外写了一个面向 pixiv 的库:pixiver 支持通过作品 ID 获取相关信息.下载等,支持通过日期浏览各种排行榜(包括R-18),支持通过 p ...
吴裕雄--天生自然python学习笔记：爬取我国 1990 年到 2017年 GDP 数据并绘图显示
绘制图形所需的数据源通常是不固定的,比如,有时我们会需要从网页抓取, 也可能需从文件或数据库中获取. 利用抓取网页数据技术,把我国 1990 年到 2016 年的 GDP 数据抓取出来 ,再利用 Ma ...
Python爬虫小白入门（六）爬取披头士乐队历年专辑封面-网易云音乐
一.前言前文说过我的设计师小伙伴的设计需求,他想做一个披头士乐队历年专辑的瀑布图. 通过搜索,发现网易云音乐上有比较全的历年专辑信息加配图,图片质量还可以,虽然有大有小. 我的例子怎么都是爬取图片? ...
教你爬取腾讯课堂、网易云课堂、mooc等所有课程信息
本文的所有代码都在GitHub上托管,想要代码的同学请点击这里
Python学习笔记之爬取网页保存到本地文件
爬虫的操作步骤: 爬虫三步走爬虫第一步:使用requests获得数据: (request库需要提前安装,通过pip方式,参考之前的博文) 1.导入requests 2.使用requests.get ...
python爬虫学习01--电子书爬取
python爬虫学习01--电子书爬取 1.获取网页信息 import requests #导入requests库 ''' 获取网页信息 ''' if __name__ == '__main__': ...
[python爬虫] Selenium定向爬取虎扑篮球海量精美图片
前言: 作为一名从小就看篮球的球迷,会经常逛虎扑篮球及湿乎乎等论坛,在论坛里面会存在很多精美图片,包括NBA球队.CBA明星.花边新闻.球鞋美女等等,如果一张张右键另存为的话真是手都点疼了.作为程序员 ...
Python爬虫实例：爬取猫眼电影——破解字体反爬
字体反爬字体反爬也就是自定义字体反爬,通过调用自定义的字体文件来渲染网页中的文字,而网页中的文字不再是文字,而是相应的字体编码,通过复制或者简单的采集是无法采集到编码后的文字内容的. 现在貌似不少网 ...

随机推荐

【转发】Linux中设置服务自启动的三种方式
有时候我们需要Linux系统在开机的时候自动加载某些脚本或系统服务主要用三种方式进行这一操作: ln -s 在/etc/rc.d/rc*.d目录中建立/e ...
em和px的区别一次彻底搞清楚！
在国内网站中,包括三大门户,以及“引领”中国网站设计潮流的蓝色理想,ChinaUI等都是使用了px作为字体单位.只有百度好歹做了个可调的表率.而在大洋彼岸,几乎所有的主流站点都使用em作为字体单位, ...
Jsonnet-PHP v1.3.0 发布，支持 PHP 7 使用 Jsonnet
JsonNet-PHP 是 Google Jsonnet 对 PHP的支持扩展. pecl: http://pecl.php.net/package/jsonnet github: https://g ...
重新学习MySQL数据库3：Mysql存储引擎与数据存储原理
重新学习Mysql数据库3:Mysql存储引擎与数据存储原理数据库的定义很多开发者在最开始时其实都对数据库有一个比较模糊的认识,觉得数据库就是一堆数据的集合,但是实际却比这复杂的多,数据库领域中有 ...
rsa加解密密钥生成命令
(1)生成原始RSA私钥文件 rsa_private_key.pem(原始私钥) openssl genrsa -out rsa_private_key.pem 2048 (2)将原始RSA私钥转换为 ...
uva 12356 Army Buddies 树状数组解法树状数组求加和恰为k的最小项号难度:1
Nlogonia is fighting a ruthless war against the neighboring country of Cubiconia. The Chief General ...
十八、dbms_repair(用于检测,修复在表和索引上的损坏数据块)
1.概述作用:用于检测,修复在表和索引上的损坏数据块. 2.包的组成 1).admin_tables语法:dbms_repair.admin_tables(table_name in varchar ...
Docker的大坑小洼(二)
再谈<Docker的大坑小洼> 今天闲暇看了一下宏亮同学写的一篇<Docker的大坑小洼>,非常受启发.因为Docker的文章真的很多了,但大家如果只是玩一玩,有很多坑是不会碰 ...
2016年度，这40项IT技能年薪轻松超过10万美元
众所周知,科技行业聚集了大批高薪职位,但这同样也是一个快速变化的市场.今天的热门技能明天就有可能惨遭淘汰. 求职网站Dice.com最近发布了<2016薪酬调查>, 列举了年薪最高的各种科 ...
Django WSGI,MVC,MTV,中间件部分,Form初识
一.什么是WSGI? WEB框架的本质是一个socket服务端接收用户请求,加工数据返回给客户端(Django),但是Django没有自带socket需要使用别人的 socket配合Django才能 ...

Python学习-使用Python爬取陈奕迅新歌《我们》网易云热门评论

Python学习-使用Python爬取陈奕迅新歌《我们》网易云热门评论的更多相关文章

随机推荐

热门专题