对于某东平台XX娃娃的用户体验进行(严肃、限速)数据分析
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理
本次的爬取目标是某东的一个商品,但从来没有用过,所以本人很好奇。我们就采集这个商品的评论,看看用过的人怎么说,体验如何。最后在词云显示这次的关键词
本次目标
某东商品评论,并词云显示关键词
受害者地址
https://item.jd.com/12520305479.html#crumb-wrap
真刺激
环境
- Python 3.6
- pycharm
爬虫代码
导入工具
import requests
import time
import re
通过开发者工具可以找到相对应的数据接口
查看接口数据参数
多查看几页数据,可以发现page是从 0 1 2 3 开始相对应页数
注意点:
- 网页是GBK编码需要转码
- 返回数据可用正则提取,并非json数据
开始爬取评论数据
for page in range(0, 100):
url = 'https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=12520305481&score=0&sortType=5&page={}&pageSize=10&isShadowSku=0&rid=0&fold=1'.format(page)
headers = {
'cookie': 'PCSYCityID=CN_0_0_0; jwotest_product=99; areaId=18; ipLoc-djd=18-1482-48936-0; unpl=V2_ZzNtbUtfQUYgCEEEfUtZA2IFEQ5LAxYTcVpOASxLXAJgUBEKclRCFnQURlVnGVQUZwQZWUFcRxVFCEdkeB5fA2AFEFlBZxBFLV0CFi9JH1c%2bbRdZQF5EHHwAQ1R8KWwGZzMSXHJTQhV2DE5RchFsNWAzIm1AVUUUfA92VUsYbEczXxpUS1FLHTgMR1R4HVQAbgsiXHJU; __jdv=76161171|baidu-search|t_262767352_baidusearch|cpc|45386889416_0_893bd16a7c47472b8ed75c9dfc166b2f|1603097572255; __jdu=501259489; shshshfpb=tD5U5kzKI%2FrPwiQKAePBtLQ%3D%3D; shshshfpa=7a29fb15-8ae0-995d-303d-02ced1f37473-1601270653; __jda=122270672.501259489.1603097571.1603097571.1603097572.1; __jdc=122270672; shshshfp=8605b9031ad5da18cc9f19e47d4edcba; 3AB9D23F7A4B3C9B=C6CFZWH3AOQJASJVY4I5ZGKYGRGCYTU4KH4XYGXAXS5MQ3QRIGKR7TSLJWPIMM7X2SE6I6WLMCB5ZIYCYBSOO4KRBI; shshshsID=4596a4a3bf541ff0cee5bb2d2a1d9714_6_1603097694903; __jdb=122270672.6.501259489|1.1603097572; JSESSIONID=F2250FD11DD25985B7572DD293CBDC12.s1',
'referer': 'https://item.jd.com/12520305481.html',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
}
response = requests.get(url=url, headers=headers)
for i in lis:
with open('商品评论.txt', mode='a', encoding='utf-8') as f:
f.write(i)
f.write('\n')
print(i)
运行代码,效果如下图
emmmm,评论很精彩,嘿嘿
词云代码
import jieba
import wordcloud
import imageio
# 导入imageio库中的imread函数,并用这个函数读取本地图片,作为词云形状图片
# py = imageio.imread(r"D:\python\demo\京东娃娃\timg.png")
f = open(r'评论数据地址', encoding='utf-8')
txt = f.read()
# print(txt)
# jiabe 分词 分割词汇
txt_list = jieba.lcut(txt)
string = ' '.join(txt_list)
# 词云图设置
wc = wordcloud.WordCloud(
width=1000, # 图片的宽
height=700, # 图片的高
background_color='white', # 图片背景颜色
font_path='msyh.ttc', # 词云字体
# mask=py, # 所使用的词云图片
scale=15,
stopwords={'真的', '感觉', '这个', '这个', '这个'},
# contour_width=5,
# contour_color='red' # 轮廓颜色
)
# 给词云输入文字
wc.generate(string)
wc.to_file(r'保存图片地址')
看来大家对这款商品的评价都很不错呀
对于某东平台XX娃娃的用户体验进行(严肃、限速)数据分析的更多相关文章
- 国内各大互联网公司UED(用户体验设计)团队博客介绍
UED是什么UED = user experience design,用户体验设计.UED的通常理解,就是“我们做的一切都是为了呈现在您眼前的页面”.UED团队包括:交互设计师(Interactio ...
- #AOS应用基础平台# 实现了在用户权限范围内自己定义的快捷菜单的导航展示
from=501" style="color:rgb(255,131,115); padding:0px; margin:0px; font-family:微软雅黑,Verdana ...
- 【To B产品怎么做?】泛用户体验
目录 - 什么是泛用户体验? - 如何做好泛用户体验? - 泛用户体验有什么用? *预计阅读时间15分钟 不知道你有没有过这种体验,客服妹子的声音软糯,氛围微妙,用词标准,张口就是:给你带来了不好的体 ...
- 诺基亚远去,《惊奇UCD》带你重塑用户体验
我所说的成功的用户体验,是指我见过或听说过大量的用户非常喜爱我为手机行业做出的那些贡献.我的职业幸福感并不取决于我的经理或CEO说了什么,而是取决于我从实际用户那里听到了什么. ...
- Atitit.hybrid混合型应用 浏览器插件,控件的实现方式 浏览器运行本地程序的解决方案大的总结---提升用户体验and开发效率..
Atitit.hybrid混合型应用 浏览器插件,控件的实现方式 浏览器运行本地程序的解决方案大的总结---提升用户体验and开发效率.. 1. hybrid App 1 1.1. Hybrid Ap ...
- 对cnblogs.com用户体验的评价
一.对于cnblogs.com的用户体验我们先对以下问题进行回答: 1.你是什么样的用户, 有什么样的心理, 对cnblogs 的期望值是什么? 我们是正在学习软件工程课程的在校计算机专业大学生,在博 ...
- HTML5如何重塑O2O用户体验
低频次垂直O2O服务应该继续开发原生APP吗?大家有没有发现做一个APP的推广成本和获取用户的成本越来越高?第二,用户安装APP之后,用户并不是经常点击使用APP的,那这是为什么?数据表明90%的O2 ...
- 提升网站用户体验—WebP 图片的高效使用
一.WebP 的由来 现代图像压缩技术对我们的生活方式影响很大.数码相机能将上千张高质量图片存储到一张内存卡里.智能手机可以与邻近设备快速分享高分辨率的图片.网站与手机等移动设备能快速展示各种富媒体. ...
- (转)iOS Wow体验 - 第三章 - 用户体验的差异化策略
本文是<iOS Wow Factor:Apps and UX Design Techniques for iPhone and iPad>第三章译文精选,其余章节将陆续放出.上一篇:Wow ...
随机推荐
- java里的锁总结(synchronized隐式锁、Lock显式锁、volatile、CAS)
一.介绍 首先, java 的锁分为两类: 第一类是 synchronized 同步关键字,这个关键字属于隐式的锁,是 jvm 层面实现,使用的时候看不见: 第二类是在 jdk5 后增加的 Lock ...
- Redis主从复制、多实例、高可用
Redis主从复制 在开始实现redis的高可用之前,首先来学习一下如何实现redis的主从复制,毕竟高可用也会依赖主从复制的技术. Redis的主从复制,可以实现一个主节点master可以有多个从节 ...
- 【Java并发编程】从CPU缓存模型到JMM来理解volatile关键字
目录 并发编程三大特性 原子性 可见性 有序性 CPU缓存模型是什么 高速缓存为何出现? 缓存一致性问题 如何解决缓存不一致 JMM内存模型是什么 JMM的规定 Java对三大特性的保证 原子性 可见 ...
- python-数据清洗与编码解码
0x01 join str = 'hk$$yicunyiye$$hello world' print(str.split('$$')) #自己实现 result = '' for i in str.s ...
- 爬虫必看,每日JS逆向之爱奇艺密码加密,今天你练了吗?
友情提示:优先在公众号更新,在博客园更新较慢,有兴趣的关注一下知识图谱与大数据公众号,本次目标是抠出爱奇艺passwd加密JS代码,如果你看到了这一篇,说明你对JS逆向感兴趣,如果是初学者,那不妨再看 ...
- Kubernetes K8S之Ingress详解与示例
K8S之Ingress概述与说明,并详解Ingress常用示例 主机配置规划 服务器名称(hostname) 系统版本 配置 内网IP 外网IP(模拟) k8s-master CentOS7.7 2C ...
- Spring学习(九)Spring 和数据库编程【了解】
一.传统 JDBC 回顾 用一个大佬的demo来简单看一下 /** * 使用jdbc,根据id查询单个Student的信息 */ public class JdbcManage { public St ...
- Ubuntu16.04 Nvidia显卡驱动简明安装指南
简单得整理了一下Ubuntu16.04 Nvidia显卡驱动的安装步骤: 查看当前系统显卡参数: sudo lspci | grep -i nvidia 删除之前的驱动: sudo apt-get - ...
- 神作!阿里首发并发编程神仙笔记,Github已星标92K
Qzone 微信 神作!阿里首发并发编程神仙笔记,Github已星标92K JAVA超神编程 2020-09-23 21:04:06 JVM 无论什么级别的Java从业者,JVM都是进阶时必须迈过的坎 ...
- Spring AOP系列(二) — 动态代理引言
接上一篇Spring AOP系列(一)- 代理模式,本篇来聊聊动态代理. 动态代理与静态代理的区别 要想了解动态代理与静态代理的区别,需要有两个前置知识点:java程序是如何执行的以及类加载机制. j ...