Python实战之自己主动化评论
Python实战之自己主动化评论
玩csdn博客一个多月了,渐渐发现了一些有意思的事,常常会有人用相同的评论到处刷。不知道是为了加没什么用的积分,还是纯粹为了表达楼主好人。那么问题来了,这种无聊的事情当然最好能够自己主动化咯。自己也来试了一把,纯属娱乐。
登陆
要评论当然要能够先进行登陆,採用 requests 库进行处理,尝试是否能看到自己的消息列表:
msg_url ="http://msg.csdn.net/"
r = requests.get(msg_url, auth=('drfish', 'password'))
结果跳转到登陆界面,好的那看一下登陆界面是怎么登陆的,找到表单:
发现另一些隐藏的參数,如lt、excution等,好心的程序员还写明了不能为什么不能直接认证的原因:缺少流水号,那就多訪问一次来获取流水号好了,用 BeautifulSoup 来分析页面内容抓取流水号,同一时候由于要跨不同的域来进行操作,所以引入session:
msg_url = "http://msg.csdn.net/"
login_url = "https://passport.csdn.net/"
headers = {
'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
session = requests.session()
session.headers.update(headers)
r = session.get(login_url)
page = BeautifulSoup(r.text, "lxml")
authentication = {
"username": "drfish",
"password": "password",
"lt": page.select("[name=lt]")[0]["value"],
"execution": page.select("[name=execution]")[0]["value"],
"_eventId": "submit",
}
r = session.post(login_url, authentication)
r2 = session.get(msg_url)
print(r2.text)
好了。如今能够得到我的消息信息了,说明已经成功解决登陆问题,那么自己主动化水军评论应该就近在眼前了。
自己主动评论
这次学乖了。随便找了篇文章直接查看评论框form:
在上面登陆代码的基础上进行评论的提交:
blog_url = "http://blog.csdn.net/u013291394/comment/submit?id=50444369"
comment = {
"comment_content": "水军评论測试",
"comment_usrId":"531203"
}
r2 = session.post(blog_url, comment)
print(r2.text)
结果返回了 {"result":0,"content":"评论内容没有填写!","callback":null,"data":null} 这种结果。
有点意思。应该是在js中对參数进行了处理。
那就把js拉出来看看。网页里搜了一下js文件,有个 comment.js 。就是它了。在上面的form中能够看到提交时调用了subform方法,查看方法例如以下:
function subform(e) {
if (c_doing) return false;
var content = $.trim($(editorId).val());
if (content == "") {
commentTip("评论内容没有填写!");
return false;
} else if (content.length > 1000) {
commentTip("评论内容太长了,不能超过1000个字符。");
return false;
}
var commentId = $("#commentId").val();
commentTip("正在发表评论...");
var beginTime = new Date();
$(editorId).attr("disabled", true);
$("button[type=submit]", e).attr("disabled", true);
c_doing = true;
$.ajax({
type: "POST",
url: $(e).attr("action"),
data: {
"commentid": commentId,
"content": content,
"replyId": $("#comment_replyId").val(),
"boleattohome": $("#boleattohome").val()
},
success: function (data) {
c_doing = false;
commentTip(data.content);
if (data.result) {
var rcommentid=$("#comment_replyId").val()
$(editorId).val('');
$("#comment_replyId,#comment_verifycode").val('');
commentscount++;
loadList(1, true);
$(editorId).attr("disabled", false);
$("button[type=submit]", e).attr("disabled", false);
commentTip("发表成功!
评论耗时:" + (new Date() - beginTime) + "毫秒")
if (rcommentid!=undefined && rcommentid != "")
{
$("html,body").animate({ scrollTop: $("#comment_item_" + rcommentid).offset().top }, 1000);
}
}
}
});
return false;
}
能够清楚的看到最后POST提交的数据 data 改变了參数的名字,还有几个其它的參数通过看js文件能够看到不是空的就是定死的,就不用管他了。
同一时候发现上的 "comment_usrId" 也是给死的?那就仅仅要comment一个变量就搞定了。
blog_url = "http://blog.csdn.net/u013291394/comment/submit?
id=50444369"
comment = {
"content": "水军评论測试",
}
r2 = session.post(blog_url, comment)
print(r2.text)
看一下效果:
自己主动化
当然上面终于的參数传递也能够自己手动评论并用抓包软件抓取,只是通过查看 commetn.js 文件也给我的自己主动化评论提供了方向,当中有一个 load_comment_form() 方法。是用来载入comment-form的,它给出了action的定义:
action="/' + username + '/comment/submit?id=' + fileName + '"
写的非常明确了。我仅仅要抓取到页面的作者名和文章的编号就能够尽情的水评论了,随便选个抓取文章的入口,如最新博客入口 ref=toolbar_logo">http://blog.csdn.net/? ref=toolbar_logo
执行脚本试一下效果:
打开评论管理看一下:
自己主动化评论成功。
写在最后
写这篇文章仅仅是为了证明一下自己的想法,不是用来也不希望有人用来恶意刷评论。
- 本文由 DRFish(http://www.drfish.me/)原创。转载请写明原链接,谢谢。
须要參考源代码请訪问我的Github (https://github.com/gavinfish/Awesome-Python/tree/master/HotBlog)。
Python实战之自己主动化评论的更多相关文章
- Selenium2 Python 自己主动化測试实战学习笔记(五)
7.1 自己主动化測试用例 无论是功能測试.性能測试和自己主动化測试时都须要编写測试用例,測试用例的好坏能准确的体现了測试人员的经验.能力以及对项目的深度理解. 7.1.1 手工測试用例与自己主动化測 ...
- jQuery2.0应用开发:SSH框架整合jQuery2.0实战OA办公自己主动化(VSS、operamasks-UI框架)
我的qq是2059055336,对这个课程有兴趣的能够加我qq联系. 一.本课程是怎么样的一门课程(全面介绍) 1.1.课程的背景 jQuery 2.0 正式版公布.不在支持 IE 6/7/8 ...
- Android 自己主动化測试(3)<monkeyrunner> 依据ID查找对象&touch&type (python)
我在之前的两篇文章中用java来实现过 Android 自己主动化測试(1)怎样安装和卸载一个应用(java).Android 自己主动化測试(2)依据ID查找对象(java). 可是本质上都是用mo ...
- python爬虫实战---爬取大众点评评论
python爬虫实战—爬取大众点评评论(加密字体) 1.首先打开一个店铺找到评论 很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手.很多已经 ...
- Mock+Proxy在SDK项目的自己主动化測试实战
项目背景 广告SDK项目是为应用程序APP开发者提供移动广告平台接入的API程序集合,其形态就是一个植入宿主APP的jar包.提供的功能主要有以下几点: - 为APP请求广告内容 - 用户行为打点 - ...
- Maven实战(五)——自己主动化Web应用集成測试
自己主动化集成測试的角色 本专栏的上一篇文章讲述了Maven与持续集成的一些关系及详细实践,我们都知道,自己主动化測试是持续集成不可缺少的一部分,基本上,没有自己主动化測试的持续集成,都非常难称之为真 ...
- zeromq 学习和python实战
参考文档: 官网 http://zeromq.org/ http://www.cnblogs.com/rainbowzc/p/3357594.html 原理解读 zeromq只是一层针对socke ...
- Android自己主动化測试解决方式
如今,已经有大量的Android自己主动化測试架构或工具可供我们使用,当中包含:Activity Instrumentation, MonkeyRunner, Robotium, 以及Robolect ...
- [Openstack]使用devstack自己主动化安装
os环境为: ubuntu14.04 安装步骤: 更新系统软件包: sudo apt-get dist-upgrade #出现无法訪问到ubuntu官网的错误. 安装git: sudo apt-get ...
随机推荐
- R语言处理1975-2011年的人口信息
1975-2011年的数据中. 1)分别统计每年人口最多的国家是哪个?有多少 2)统计出各个国家的1975-2011年的平均人口增长率 3)统计每年人口最多的十个国家 4)统计出每年人口最少的十个国家 ...
- hdoj--1045<dfs&二分图最大匹配>(这里是dfs解法)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1045 题目描述: 在矩阵中放车,车可四面攻击,矩阵中有墙,可以防止攻击,给出墙的位置,输出最多可以放多 ...
- ie,360浏览器出现无法打开网页(包括本地html)的解决方法
有一天,编写网页照例打开chrome,ie,360等浏览器,发现ie,360均无法打开本地网页,输入百度,也无法打开,从没遇到过这种情况,通过百度,找了几种方法,没解决, 后来,看到有一种原因可能是浏 ...
- BZOJ4916 神犇和蒟蒻 【欧拉函数 + 杜教筛】
题目 很久很久以前,有一只神犇叫yzy; 很久很久之后,有一只蒟蒻叫lty; 输入格式 请你读入一个整数N;1<=N<=1E9,A.B模1E9+7; 输出格式 请你输出一个整数A=\sum ...
- Ubuntu12.04 64bit版本下载Android源码完整教程
首先去官网http://source.android.com/source/initializing.html可以看到完整的安装教程.不过一般情况下,按照这个教程是无法一步到位的,因为中途肯定会遇到很 ...
- json键的不能像值一样拼写的问题
今天碰到了一个json的键不能拼写的问题 解决方法是 先把json对象作为一个字符串拼写 然后再通过eavl函数转为json对象 $(".select_date").each( ...
- 【Visual Studio】MFC编辑框自动换行,垂直滚动条自动下移(转)
原文转自 http://blog.csdn.net/wu_lai_314/article/details/8317395 1.新建一个编辑框控件(Edit Control),将其多行(Multilin ...
- UVA - 10196:Check The Check
类型:简单模拟 大致题意:已知国际象棋行棋规则,给你一个局面,问是否将军?谁将谁的军?(保证不会同时将军) 思路:都以小写字母 测试 是否将 大写字母. 然后一个局面测两次(一次直接测,一次反转棋盘, ...
- [原创][FPGA]有限状态机FSM学习笔记(一)
1. 概述--何为有限状态机FSM? 有限状态机-Finite State Machine,简写为FSM,是表示有限个状态及在这些状态之间的转移和动作等行为的数学模型,在计算机领域有着广泛的应用.通常 ...
- CDOJ 92 Journey LCA乱搞
原题链接:http://acm.uestc.edu.cn/#/problem/show/92 题意: 给你一棵树,然后在树上连接一条边.现在有若干次询问,每次问你两个点(u,v)之间的距离在加那条边之 ...