python爬虫——跟踪登录过程以及意外的发现（4）

　　新浪微博的消息还是很多的，值得弄个账号去爬。不过都有账号了，还需要特意再搞一个吗？

　　直接上去跟踪。分别使用www和wap端登录：

　　wap端相对简单，form表单都没有用到前面传的数据。但是我看到表单时，差点TM把水喷出来了

　　（password为了防止泄密已涂，还有上面的属性也是空字符串不用看了）不止是username，连password也TM明文传输？？好歹也搞个非对称加密吧！

　　不过如果这个账号不是自己的主账户也无所谓啦，这样反倒方便了许多~~

　　并且wap端没有那么多的css和js，url也是极其简单，搜索“acm-icpc”直接写：https://weibo.cn/search/mblog?keyword=acm-icpc

点赞人：weibo.cn/attitude/<ID>?page=

评论：weibo.cn/comment/<ID>?page=

转发：weibo.cn/repost/<ID>?page=

　　不像www端有神烦的cookie和js处理：

　　http://lovenight.github.io/2015/11/23/Python-%E6%A8%A1%E6%8B%9F%E7%99%BB%E5%BD%95%E6%96%B0%E6%B5%AA%E5%BE%AE%E5%8D%9A/

python爬虫——跟踪登录过程以及意外的发现（4）的更多相关文章

python爬虫模拟登录验证码解决方案
[前言]几天研究验证码解决方案有三种吧.第一.手工输入,即保存图片后然后我们手工输入:第二.使用cookie,必须输入密码一次,获取cookie:第三.图像处理+深度学习方案,研究生也做相关课题,就用 ...
Python爬虫模拟登录带验证码网站
问题分析: 1.爬取网站时经常会遇到需要登录的问题,这是就需要用到模拟登录的相关方法.python提供了强大的url库,想做到这个并不难.这里以登录学校教务系统为例,做一个简单的例子. 2.首先得明白 ...
python爬虫模拟登录的图片验证码处理和会话维持
目标网站:古诗文网登录界面显示: 打开控制台工具,输入账号密码,在ALL栏目中进行抓包数据如下: 登录请求的url和请求方式登录所需参数参数分析: __VIEWSTATE和__VIEWSTAT ...
python 爬虫001-http请求过程
HTTP 请求流程一次完整的HTTP请求过程从TCP三次握手建立连接成功后开始,客户端按照指定的格式开始向服务端发送HTTP请求,服务端接收请求后,解析HTTP请求,处理完业务逻辑,最后返回一个HT ...
python爬虫之登录
#-*-coding:utf--*- import cookielib, urllib, urllib2 import json import threading,time class Order(o ...
Python爬虫目录
Python爬虫目录工具使用 Pycharm 连接Linux 远程开发 mongodb在windows下安装启动爬虫抓包工具Fiddle设置爬虫抓包工具Charles设置爬虫工具fiddle在 ...
python爬虫中图形验证码的处理
使用python爬虫自动登录时,遇到需要输入图形验证码的情况,一个比较简单的处理方法是使用打码平台识别验证码. 使用过两个打码平台,打码兔和若快,若快的价格更便宜,识别率相当.若快需要注册两个帐号:开 ...
[Python爬虫] Selenium实现自动登录163邮箱和Locating Elements介绍
前三篇文章介绍了安装过程和通过Selenium实现访问Firefox浏览器并自动搜索"Eastmount"关键字及截图的功能.而这篇文章主要简单介绍如何实现自动登录163邮箱,同时 ...
定向爬虫 - Python模拟新浪微博登录
当我们试图从新浪微博抓取数据时,我们会发现网页上提示未登录,无法查看其他用户的信息. 模拟登录是定向爬虫制作中一个必须克服的问题,只有这样才能爬取到更多的内容. 实现微博登录的方法有很多,一般我们在模 ...

随机推荐

classmethod作用
>>> class A(object): bar = 1 def func1(self): print 'foo' >>> class A(object): bar ...
C# WinForm窗体隐藏右上角最小化、最大化、关闭按钮
C# WinForm窗体隐藏右上角最小化.最大化.关闭按钮如何赢藏WinForm窗体的右上角按钮设置设置ControlBox = false: 设置ControlBox = false:
vscode 同步配置
按照插件完成配置之后,将token保存在本地,编辑配置文件:ctrl+3.sync高级选项.编辑本地扩展设置.将token粘贴进去即可,团队所有vscode均应该按照此配置来保持统一:
ToolBar样式颜色，图标设置
extends:http://blog.csdn.net/w1054993544/article/details/48339565 <resources> <style name=& ...
PHP删除数组中空值的方法
Thinkphp路由配置和静态缓存规则【原创】
ThinkPHP框架对URL有一定的规范,所以如果你希望定制你的URL格式的话,就需要好好了解下内置的路由功能了,它能让你的URL变得更简洁和有文化. 首先我们在Common/config.php设置 ...
页面初始化document.body.clientWidth大小变化
目前:原因不明初步判断:设置字体大小前图片加载失败! 结果:等待验证
用VsCode写Markdown
Markdown 基本语法段落非常自然,一行文字就是一个段落. 比如: 这是一个段落会被解释成: 这是一个段落. 如果你需要另起一段,请在两个段落之间隔一个 ...
linux_rename命令用法
rename在man中的解释为: NAME rename - rename files SYNOPSIS rename [options] expression replacement file... ...
[efficiency] emacs入门
一. 没记错的话,这可能是第三次读emacs tutorial了.前两次读的非常慢,也不记得有没有读完了.总之最后都忘光了. 这次读的很顺畅,利用工作的空闲时间加上今天晚上(周日).总算是读完了. 没 ...

python爬虫——跟踪登录过程以及意外的发现（4）

python爬虫——跟踪登录过程以及意外的发现（4）的更多相关文章

随机推荐

热门专题