0-定评论结果:好评.差评,1星.4星,二元化为“积极.消极”,取一元的数据为样本 1-得到词频结果:如手机类的“积极样本”得到前10的高频词:运行(run running ran).内存(memory).速度(speed) 2-建立key-value.keys-values的多对多 .n:n键值对,样本继承2 内存--->大/小 运行--->快 速度--->快 2-1-n:n键值对可“同义词合并”或“卖品实质用户体验一致”聚类为一对一 .1:1,但此处非一一映射 3-根据2中结果进行产…
关键字:APIfen.工具使用.sql注入 涉及工具/包:Fiddler.Burpsuite.Js2Py.Closure Compiler.selenium.phantomjs.sqlmap 摘要: 记录分析某音乐类App评论相关API的过程,以及一些工具/包的基本使用(部分工具对最后尝试没有影响,但在其它场景或许有用),最后结合sqlmap进行注入尝试.本文对于sql注入没有深入展开(水平不够…). 想法来源:本想写个程序获取零评论的歌曲,去占沙发…分析发现获取评论的POST请求参数有点复杂……
网易云音乐-感受音乐的力量 你选择的产品是?  网易云音乐 为什么选择该产品作为分析? 之前用的一直是QQ音乐,但是有一天一个朋友分享了一首网易云上的音乐(顺便分享一下歌名:Drop By Drop),觉得挺好听的,本来想用QQ音乐下载,却发现找不到这一首歌,于是便下载了网易云音乐,发现还挺好用的,有些歌曲也不像QQ音乐那样需要收费而是可以免费下载. 该产品是怎么诞生的(在什么样的背景下)? 背景[1]: 在新旧技术标准的竞争中,数字时代的音乐产业实现了企业战略.技术.产业组织与制度的共同演化,…
[python] 常用正则表达式爬取网页信息及分析HTML标签总结 转http://blog.csdn.net/Eastmount/article/details/51082253 标签: pythonpython爬虫正则表达式html知识总结 2016-04-07 06:13 3615人阅读 评论(4) 收藏 举报  分类: Python爬虫(23)  Python基础知识(17)  版权声明:本文为博主原创文章,转载请注明CSDN博客源地址!共同学习,一起进步~ 这篇文章主要是介绍Pytho…
前言:本文主要涉及知识点包括新浪微博爬虫.python对数据库的简单读写.简单的列表数据去重.简单的自然语言处理(snowNLP模块.机器学习).适合有一定编程基础,并对python有所了解的盆友阅读. 甩锅の声明 1.本数据节选自新浪热门微博评论,不代表本人任何观点 2.本人不接受任何非技术交流类批评指责(夸我可以) 3.本次分析结果因技术问题存在一定误差(是引入的包的问题,不是我的) 4.本次选取热门微博为一个月以前的(翻译一下:热点已经冷了,我只是个写教程的) 4.顶锅盖逃 继上次更完"国…
Hadoop基础--统计商家id的标签数案例分析 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.项目需求 将“temptags.txt”中的数据进行分析,统计出商家id的评论标签数量,由于博客园无法上传大文件的文本,因此我把该文本的内容放在博客园的另一个链接了(需要的戳我),如果网页打不开的话也就可以去百度云盘里下载副本,链接:https://pan.baidu.com/s/1daRiwOVe6ohn42fTv6ysJg 密码:h6er. 实现效果如下: 二.代码实现 /…
项目 内容 这个作业属于哪个课程 2020春季计算机学院软件工程(罗杰 任健) (北京航空航天大学 - 计算机学院) 这个作业的要求在哪里 个人博客作业-软件案例分析 我的教学班级 005 说说csdn ​ 作为中国较出名的中文博客社区,csdn对很多开发者的成长都给予过帮助.既然要分析其移动端app,我想先谈谈我对csdn的看法,特点可以总结为八个字:好坏参半.优缺明显. ​ 首先,它拥有强大的markdown编辑器,支持在线编辑博客,效果美观,重要的是编辑页面效果与博客发布效果一致,所见即所…
Android操作系统本身就是一个巨大的开源软件仓库,熟悉它既可以了解到Android系统的设计框架,也可以获得高效的应用程序编写方式.本文所分析的源码来自于Google官方的AOSP源码4.0.1_r1,手机的Android版本是CM 4.2.2.对于Android系统分析而言,手机的操作系统版本和源码版本有些不一致的地方不会有太大的影响,但是如果需要将源码中的修改安装到手机里面的话,最不容易遇到问题的办法就是保持手机中系统的版本和源码的版本完全一致了. 1.程序入口发现 每一个应用程序都应当…
由于后续篇幅比较大,所以调整了内容结构. 全系列 [HELLO WAKA]WAKA iOS客户端 之一 APP分析篇 [HELLO WAKA]WAKA iOS客户端 之二 架构设计与实现篇 [HELLO WAKA]WAKA iOS客户端 之三 创作模块分析与实现篇(上) [HELLO WAKA]WAKA iOS客户端 之三 创作模块分析与实现篇(下) [HELLO WAKA]WAKA iOS客户端 之四 服务器架构设计 MAKA 上周三发布了iOS客户端1.0.本着学习的态度,对MAKA客户端做…
在17的四月份,我曾经写了一篇关于网易云音乐爬虫的文章,还写了一篇关于评论数据可视化的文章.在这大半年的时间里,有时会有一些朋友给我发私信询问一些关于代码方面的问题.所以我最近抽空干脆将原来的代码整理了一下,做成了一个Python模块NetCloud放在Pypi上了.目前只是对原来的代码做了一些整理与重构,功能还很不完善,后续打算抽空继续完善,如果有人用的话可能会长期维护下去. 目前只需要使用命令pip install NetCloud 即可以完成模块的安装,支持Windows与Linux系统,…