前言

文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取t.cn/A6Zvjdun

前一阵子,由于肖战的“227事件”微博和朋友圈都被刷屏,起因在与肖战的粉丝发现在AO3作品库平台收录关于肖战的同人作品,认为该部作品影响了肖战的形象,遂向有关部门举报,最终告知知名同人网站A03(Archive of our own)作品库无法被访问。

这也对爱好同人作品的读者与作者都造成了不可逆转的伤害。随即,他们联合其他路人便组成227大团结,共同抵制肖战及其粉丝,一时间与肖战紧密联系的品牌商家纷纷撤换其代言人与品牌形象大使。

​小编并不是肖战的粉丝,对其出演的作品看的也不多,这次就从爬虫以及数据可视化的角度(数据来源是微博上肖战的评论粉丝)来为大家呈现肖战粉丝的人群画像。

爬虫逻辑分成三步:

01采集肖战的所有微博

首先获取明星发的所有的微博ID,在有了这些ID之后,便可以拼接成了微博评论的第一页的URL

另外在翻页的操作时,微博评论的下一页链接的参数通常在本页的末尾,所以在每次爬取时,也要记得抓取下一页链接的重要参数

02采集肖战微博底下的所有评论粉丝ID

由于时间有限,小编就没有做转发与点赞粉丝ID获取的开发,但是原理类似。评论粉丝的ID获取相对容易,在xpath的指引之下,

03爬取粉丝的微博主页,并进行数据清洗

用户基本信息页面的链接通常为: “https://weibo.com/用户id/info”,所以我们只要获取用户的id就可以拿到他的公开基本信息

当然每个用户的设置不尽相同,一般来说,公开信息中包括,所在地、性别、生日以及标签等等。

粉丝的人群画像

01粉丝的地域分布

从肖战粉丝的地域分布来看,广东省、江苏、四川以及浙江省这四个省份是其粉丝最为集中的四个省份,小编将粉丝的地域分布投射到完整的地图上,我们可以发现的是中部也有几个省份,比如湖北、湖南两省以及河南,也有不少粉丝喜爱着肖战。

02粉丝的年龄分布与星座

从粉丝的年龄分布来看,大多数的粉丝年龄都集中在20岁以下的00后,以及20-25岁的90后的女性,而在30岁以上的粉丝群体则占到了极少数,

抛开年龄,我们看星座,天秤座的粉丝是最多的占到了15%,而天蝎座与射手座的粉丝数量位居其次,接近有9%的比重。不同的年龄阶段以及不同的星座,对应着不同的性格特征与喜好,或许商家品牌方在做广告以及市场营销的时候可以针对自己的目标人群精准推销以提升产品的销量

03粉丝的标签

从粉丝自己选择属于自己的标签来看,她们爱美食,是一个典型的吃货;她们热爱旅游,想要去看一下外面的世界;她们或许也比较的宅,空余的时间会选择宅在家里,听听歌,看看电影与动漫;她们中的大多数都是00后甚至是90后的学生,喜欢自由与无拘无束的生活。

从肖战的“227”事件当中,我们能够看出的是整个圈子当中存在的畸形文化,粉丝在追星过程当中,对粉的人与事都倾注了太多的情感,他们希望自己的想法与观点能够被他人所接受与认同,所以在情绪高涨之时,难免会有过激的语言与举止。同时在互联网的海量信息之下,年轻又不谙世事的粉丝又很难做到理性的分析与判断。

但是,处于这个万物联网时代下的圈层之中,因为某种情感投入和热爱而聚集到一起的,喜欢参与又渴望被认可的,希望别人鸦雀无声的,又何止是这些追逐明星的狂热粉丝呢?

如果你处于想学Python或者正在学习Python,Python的教程不少了吧,但是是最新的吗?说不定你学了可能是两年前人家就学过的内容,在这小编分享一波2020最新的Python教程。获取方式,私信小编 “ 资料 ”,即可免费获取哦!

从python爬虫以及数据可视化的角度来为大家呈现“227事件”后,肖战粉丝的数据图的更多相关文章

  1. d3.js:数据可视化利器之 交互行为:响应DOM事件

    selection.on:事件监听操作符 on()操作符可以添加或移除选择集中每个 DOM元素的事件监听函数: selection.on(type[,listener[,capture]]) 参数ty ...

  2. python爬虫(3)——用户和IP代理池、抓包分析、异步请求数据、腾讯视频评论爬虫

    用户代理池 用户代理池就是将不同的用户代理组建成为一个池子,随后随机调用. 作用:每次访问代表使用的浏览器不一样 import urllib.request import re import rand ...

  3. 吴裕雄--天生自然python数据清洗与数据可视化:MYSQL、MongoDB数据库连接与查询、爬取天猫连衣裙数据保存到MongoDB

    本博文使用的数据库是MySQL和MongoDB数据库.安装MySQL可以参照我的这篇博文:https://www.cnblogs.com/tszr/p/12112777.html 其中操作Mysql使 ...

  4. 数据可视化之powerBI入门(五)PowerQuery,支持从多种源导入数据

    PowerBI的强大绝不仅是最后生成炫酷的可视化报告,她在第一步数据获取上就显示出了强大的威力,利用Power Query 的强大数据处理功能,几乎可以从任何来源.任何结构.任何形式上获取数据 htt ...

  5. 数据可视化之powerBI技巧(四)使用Power BI制作帕累托图

    各种复杂现象的背后,其实都是受关键的少数因素和普通的大多数因素所影响,把主要精力放在关键的少数因素上,就能达到事半功倍的效果. 这就是大家常说的二八原则,也称为帕累托原则,最早是由意大利经济学家 V. ...

  6. 数据可视化之powerBI基础(一) 如何查看PowerBI图表背后的数据

    https://zhuanlan.zhihu.com/p/64405494 图表很直观,但有时候我们不仅想看图,也想更进一步查看生成该图表的明细数据,在PowerBI中有三种方式. (一)在图表上单击 ...

  7. python爬虫知识点总结(十)分析Ajax请求并抓取今日头条街拍美图

    一.流程框架

  8. 在我的新书里,尝试着用股票案例讲述Python爬虫大数据可视化等知识

    我的新书,<基于股票大数据分析的Python入门实战>,预计将于2019年底在清华出版社出版. 如果大家对大数据分析有兴趣,又想学习Python,这本书是一本不错的选择.从知识体系上来看, ...

  9. Python数据可视化编程实战——导入数据

    1.从csv文件导入数据 原理:with语句打开文件并绑定到对象f.不必担心在操作完资源后去关闭数据文件,with的上下文管理器会帮助处理.然后,csv.reader()方法返回reader对象,通过 ...

随机推荐

  1. udp和tcp特点 实现文件上传

    本周课程安排: 网络编程结束 并发网络开头 进程 线程 IO模型 上周内容回顾: 1.osi七层:应用层,表示层,会话层,传输层,网络层,数据链路层,物理连接层 也有人把他们归纳为五层: 应用层, 传 ...

  2. 题解 P5681 【面积【民间数据】】

    讲讲我的做法 分析题意 如果两人的面积一样大怎么办? 然后发现 输出仅一行一个字符串,若正方形面积大则输出 Alice,否则输出 Bob. 所以一样输\(Bob\) 算面积 \(Alice\)的面积就 ...

  3. 大型Java进阶专题(五) 设计模式之单例模式与原型模式

    前言 ​ 今天开始我们专题的第四课了,最近公司项目忙,没时间写,今天抽空继续.上篇文章对工厂模式进行了详细的讲解,想必大家对设计模式合理运用的好处深有感触.本章节将介绍:单例模式与原型模式.本章节参考 ...

  4. canvas技术概述

    canvas简介 在学习一项新技术之前,先了解这项技术的历史发展及成因会帮助我们更深刻的理解这项技术. 历史上,canvas最早是由Apple Inc. 提出的,在Mac OS X webkit中创建 ...

  5. arcgis server10.7修改打印模板后前台调用不生效

    在10.5.1及之前的版本中,如果更改打印地图模板,如字体设置,那么直接修改[ArcGIS for Server 安装目录]/Templates/ExportWebMapTemplates下的mxd的 ...

  6. Spring - 事务管理概述

      什么是事务管理? 第一个问题:什么是事务? 事务一般是相对数据库而言的,对于数据库一次操作就属于一个事务, 一次操作可以是几句 SQL 语句,也可以是若干行 JDBC 的 Java 语句.事务既然 ...

  7. 武林高手?敏捷开发,唯velocity取胜

    去年学习软件工程教材,初识敏捷开发.目前所在的团队,也是使用敏捷开发方式.今天读了这篇文章,对于这段时间的效率有所警醒.其次,个人认同文章中的用户故事,结对编程思想. 文章援引:http://gitb ...

  8. c++ 重载、继承、多态

    一.重载 1.函数重载 在同一个作用域内,可以声明几个功能类似的同名函数,但是这些同名函数的形式参数(指参数的个数.类型或者顺序)必须不同.您不能仅通过返回类型的不同来重载函数. #include & ...

  9. docker-compose搭建redis哨兵集群

    头脑风暴 出于学习目的,您可以很轻松地在docker环境下运行redis的单个实例,但是如果您需要在生产环境中运行它,那么必须将Redis部署为HA(High Avaliable)模式. Redis ...

  10. 2288: 【基础】小X转进制

    2288: [基础]小X转进制 时间限制: 1 Sec 内存限制: 256 MB 提交: 1316 解决: 576 [提交] [状态] [讨论版] [命题人:ghost79] 题目描述 小X喜欢研究进 ...