用scrapy实现模拟登陆

class Test1sSpider(scrapy.Spider):

    name = 'test1s'

    allowed_domains = ['yaozh.com']

    start_urls = ['https://www.yaozh.com/login']

    def parse(self, response):

        login_url='https://www.yaozh.com/login'

        formdata={

            'username':'taotao857',

            'pwd':'JAYO196618',

            'formhash' :response.xpath('//input[ @ id = "formhash"]/@value').extract_first(),

            'backurl':response.xpath('//input[@id="backurl"]/@value').extract_first()

        }

        yield scrapy.FormRequest(login_url,formdata=formdata,callback=self.parse_member)

    def parse_member(self,response):

        parse_member='https://www.yaozh.com/member/'

        yield scrapy.Request(parse_member,callback=self.parse_test)

    def parse_test(self,response):

        with open('lll.html','wb') as f:

            f.write(response.body)

            f.close()

用scrapy实现模拟登陆的更多相关文章

Scrapy基础(十四)————Scrapy实现知乎模拟登陆
模拟登陆大体思路见此博文,本篇文章只是将登陆在scrapy中实现而已之前介绍过通过requests的session 会话模拟登陆:必须是session,涉及到验证码和xsrf的写入cookie验证的 ...
scrapy的一些容易忽视的点（模拟登陆，传递item等）
scrapy爬虫注意事项一.item数据只有最后一条这种情况一般存在于对标签进行遍历时,将item对象放置在了for循环的外部.解决方式:将item放置在for循环里面. 二.item字段传递 ...
Scrapy 模拟登陆知乎--抓取热点话题
工具准备在开始之前,请确保 scrpay 正确安装,手头有一款简洁而强大的浏览器, 若是你有使用 postman 那就更好了. Python 1 scrapy genspid ...
第三百四十三节，Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy模拟登陆和知乎倒立文字验证码识别
第三百四十三节,Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy模拟登陆和知乎倒立文字验证码识别第一步.首先下载,大神者也的倒立文字验证码识别程序下载地址:https://gith ...
爬虫入门之scrapy模拟登陆(十四)
注意:模拟登陆时,必须保证settings.py里的COOKIES_ENABLED(Cookies中间件) 处于开启状态 COOKIES_ENABLED = True或# COOKIES_ENABLE ...
python之scrapy模拟登陆人人网
1.settings.py主要配置信息,包括USER_AGENT等 # -*- coding: utf-8 -*- # Scrapy settings for renren project # # F ...
python之scrapy携带Cookies模拟登陆
知识点 """ scrapy两种模拟登陆: 1.直接携带cookie 2.找到发送post请求的url地址,带上信息,发送请求应用场景: 1.cookie过期时间很长, ...
Scrapy模拟登陆豆瓣抓取数据
scrapy startproject douban 其中douban是我们的项目名称 2创建爬虫文件进入到douban 然后创建爬虫文件 scrapy genspider dou douban. ...
Scrapy模拟登陆
1. 为什么需要模拟登陆? #获取cookie,能够爬取登陆后的页面 2. 回顾: requests是如何模拟登陆的? #1.直接携带cookies请求页面 #2.找接口发送post请求存储cooki ...

随机推荐

安装arcgis server时提示“应用程序无法启动，因为应用程序......或使用命令行sxstrace.exe”
说一下这个原因:有几个条件不满足会产生这样的问题: 1.软件的发布是不需要安装的,直接在vs里编译好release版就发布了,而发布的时候如果缺少一些库文件,就会产生这样的问题. 一版都是目 ...
python中的可变和不可变对象有序和无序对象
可变对象和不可变对象的定义:对象存放在地址的值是否可以被改变不可变对象包括:整形int.浮点型float .字符串str .元祖tuple.布尔型boole 可变对象包括 :列表list.集合set ...
K-Folds cross-validator-K折交叉验证实现
源码: import numpy as np from sklearn.model_selection import KFold X = np.array([[, ], [, ], [, ], [, ...
B. The Monster and the Squirrel
B. The Monster and the Squirrel Ari the monster always wakes up very early with the first ray of the ...
新手必学linux文本文件编辑命令 vi vim.....
作为一名Linux新手小白,今天就和大家简单地了解一下Linux的Vim文本编辑器的使用. Vim文本编辑器 vim编辑器的三大模式——命令模式.编辑模式和末行模式命令 ...
拿万元月薪必备的书单，学JAVA的程序员必看的5本书！
点击蓝色"程序员黄小斜"关注我哟加个"星标",每天带你读好书! 文/黄小斜转载请注明出处每一年的年初都是买书学习热情高涨的时候,虽然不知道你们是让这些书吃 ...
面向对象核心技术（java）
一.类的封装详解在“面向对象编程基础(java)”的时候讲过,封装是面向对象编程的核心思想.同时我们也知道类是载体,只不过我们把对象的属性和行为封装在载体中. 现我们用封装的方式来实现,一个顾客去一 ...
Google Adsense付款方式添加西联付款
本文已同步到专业技术网站 www.sufaith.com, 该网站专注于前后端开发技术与经验分享, 包含Web开发.Nodejs.Python.Linux.IT资讯等板块. Google Adsens ...
k8s中token过期重新生成
k8s中token过期重新生成通过kubeadm初始化之后,都会提供node加入的token 默认的token的有效期是24小时,当过期了,如何新生成呢重新生成token: [root@k8s-m ...
支持向量机SVM推导
样本(\(x_{i}\),\(y_{i}\))个数为\(m\): \[\{x_{1},x_{2},x_{3}...x_{m}\} \] \[\{y_{1},y_{2},y_{3}...y_{m}\} ...

用scrapy实现模拟登陆

用scrapy实现模拟登陆的更多相关文章

随机推荐

热门专题