使用Python自动填写问卷星(pyppeteer反爬虫版)
写此文的目的是为了方便寒假自己忘记填问卷星
一开始的想法和去年一样,去年就写过一版,想着今年不过就是改改数据,换换id而已,另外没想到的事情发生了。。。
满怀信心的写完代码
from selenium import webdriver
import time
import random def run():
browser = webdriver.Chrome()
browser.get("网址") # 1
js = "document.getElementById(\"q1\").click()"
browser.execute_script(js)
browser.switch_to.frame("__calendarIframe")
js2 = "document.getElementById(\"selectTodayButton\").click()"
browser.execute_script(js2)
browser.switch_to.parent_frame() # 2
js = "document.getElementById(\"q2\").click()"
browser.execute_script(js)
browser.switch_to.frame("__calendarIframe")
js2 = "document.getElementById(\"selectTodayButton\").click()"
browser.execute_script(js2)
browser.switch_to.parent_frame() # 3
js = "document.getElementById(\"q3_1\").click()"
browser.execute_script(js) # 4
browser.find_element_by_id("q4").send_keys("学号") # 5
browser.find_element_by_id("q5").send_keys("姓名") # 6
js = "document.getElementById(\"q6_1\").click()"
browser.execute_script(js) # 7
js = "document.getElementById(\"q7_3\").click()"
browser.execute_script(js) # 8
js = "document.getElementById(\"q8_1\").click()"
browser.execute_script(js)
browser.find_element_by_class_name("underline").send_keys("第一次1月9日阴性") # 9
js = "document.getElementById(\"q9_2\").click()"
browser.execute_script(js) # 10
js = "document.getElementById(\"q10_2\").click()"
browser.execute_script(js) # 11
js = "document.getElementById(\"q12_2\").click()"
browser.execute_script(js) # 12
browser.find_element_by_id("q14").send_keys("36."+str(random.randint(0,5))+"/36."+str(random.randint(0,5))) #13
js = "document.getElementById(\"q15_2\").click()"
browser.execute_script(js) #14
js = "document.getElementById(\"q17_2\").click()"
browser.execute_script(js) #15
browser.find_element_by_id("q19").click()
time.sleep(1)
browser.switch_to.frame("PDF_i_chezchenz")
browser.find_element_by_id("txtInput").send_keys("地址")
js3="document.getElementById(\"btnSearch\").click()"
browser.execute_script(js3)
time.sleep(1)
browser.find_element_by_css_selector("a.ensure_btn").click()
time.sleep(1)
browser.switch_to.default_content() # 16
js = "document.getElementById(\"q20_2\").click()"
browser.execute_script(js) # 17
browser.find_element_by_id("q22").send_keys("无") # 18
browser.find_element_by_id('select2-q23-container').click()
# js = "document.getElementById('select2-q23-container').click()"
# browser.execute_script(js)
browser.find_element_by_xpath("//li[@class='select2-results__option'][1]").click()
# js = "document.getElementById(\"select2-q23-result-ei9q-1\").click()"
# browser.execute_script(js) # submit
js = "document.getElementById(\"submit_button\").click()"
browser.execute_script(js) if __name__ == "__main__":
while True:
run()
time.sleep(4)
break
数据都填上了,可他来了一个这玩意
然后
之后了解到用用pyppeteer解决反爬的方法,安装python第三方库asyncio、pyppeteer和pyppeteer_stealth
完整代码如下:
import asyncio
from pyppeteer import launch
from pyppeteer_stealth import stealth #反爬
import random
import time
async def run():
driver = await launch({
# 谷歌浏览器的安装路径
'executablePath': 'C:\Program Files (x86)\Google\Chrome\Application\chrome.exe',
# Pyppeteer 默认使用的是无头浏览器
'headless': False,
# 设置Windows-size和Viewport大小来实现网页完整显示
'args': ['--no-sandbox', '--window-size=1024,768']
})
page = await driver.newPage()
await page.setViewport({'width': 1024, 'height': 768})
# 反爬虫跳入网页
await stealth(page)
await page.goto('网址')
time.sleep(1)
#1 问卷填报日期
date=await page.querySelector('#q1')
await date.click()
frame =page.frames
date2= await frame[1].querySelector('#selectTodayButton')
await date2.click()
#2 体温测量日期
date = await page.querySelector('#q2')
await date.click()
frame = page.frames
date2 = await frame[1].querySelector('#selectTodayButton')
await date2.click()
#3 班级
await page.click('#divquestion3 > ul > li > a')
#4 学号
await page.type('#q4','学号')
#5 姓名
await page.type('#q5','姓名')
# 6 性别
await page.click('#divquestion6 > ul:nth-child(2) > li:nth-child(1) > a')
#7 所在地区
await page.click('#divquestion7 > ul > li:nth-child(3) > a')
#8 核酸
await page.click('#divquestion8 > ul > li:nth-child(1) > a')
await page.type('#divquestion8 > ul > li:nth-child(1) > input.underline','第一次1月9日阴性')
#9 隔离情况
await page.click('#divquestion9 > ul > li:nth-child(2) > a')
#10 密切接触
await page.click('#divquestion10 > ul:nth-child(2) > li:nth-child(2) > a')
#12 病例
await page.click('#divquestion12 > ul:nth-child(2) > li:nth-child(2) > a')
#14 体温
temperature="36."+str(random.randint(2,6))+'/'+"36."+str(random.randint(2,6))
print(temperature)
await page.type('#q14',temperature)
#15 同住人员密切接触
await page.click('#divquestion15 > ul:nth-child(2) > li:nth-child(2) > a')
#17 同住人员病例
await page.click('#divquestion17 > ul:nth-child(2) > li:nth-child(2) > a')
#19 地理位置
address= await page.querySelector('#q19')
await address.click()
time.sleep(5)
frame=page.frames
await frame[2].type('#txtInput','地址')
time.sleep(1)
await frame[2].click('#btnSearch')
time.sleep(1)
await frame[2].click('.ensure_btn')
#20 居住地变化
await page.click('#divquestion20 > ul:nth-child(2) > li:nth-child(2) > a')
# 22 异常情况
await page.type('#q22','无')
#23 同住人员
await page.click('#select2-q23-container')
persion=await page.xpath("//li[@class='select2-results__option'][1]")
await persion[0].click()
time.sleep(2)
#提交
await page.click('#submit_button')
if __name__ == '__main__':
asyncio.get_event_loop().run_until_complete(run())
就提交成功了!!!
使用Python自动填写问卷星(pyppeteer反爬虫版)的更多相关文章
- selenium+python+eclipse 实现 “问卷星”网站,登录与检查登录示例!
1.使用selenium+python+eclipse实现的登录"问卷星",问卷星访问地址:https://www.sojump.com/ 2.实现步骤:1)进入链接---首页-- ...
- python填写问卷星,疫情上报
#!!!注意:修改main里的url为真实的url,按需修改 50行 set_data中的submitdata # 61行 ip 修改为 真ip # submittype可能有错误,在151行 # 提 ...
- JavaScript——问卷星自动填写
一.前言: 我们学校要刷学术章,有些学术章又是指定在某个时间点填写问卷星的问卷报名的.但是由于我手速慢,导致总会有些时候报不上名,于是想着搞个代码实现自动填写问卷星的报名表.一顿操作后,在github ...
- 通过Python实现自动填写调查问卷
0X00 前言 快开学了,看到空间里面各种求填写调查问卷的,我才想起来貌似我也还没做.对于这种无意义的问卷,我是不怎么感冒的,所以我打算使用”特技”来完成,也就是python,顺便重新复习一下pyth ...
- UI自动化填写问卷(selenium)+定时任务(懒人必备)
1.自动填报 UI自动化 selenium 开发程序动机:天天有人催着填写问卷,弄的头大.主要还是懒的每天一个个去填写内容. 开发总时长:2个小时:学习+开发+修改 遇到的小问题: 在自动化填写地图的 ...
- Python爬虫与反爬虫(7)
[Python基础知识]Python爬虫与反爬虫(7) 很久没有补爬虫了,相信在白蚁二周年庆的活动大厅比赛中遇到了关于反爬虫的问题吧 这节我会做个基本分享. 从功能上来讲,爬虫一般分为数据采集,处理, ...
- selenium+python自动化用例登陆界面模板
一.基本逻辑 1.自动填写用户名和密码登录成功后跳转到相应页面 2.验证相应页面的url与给定的url是否一致,如果一致则测试通过,如果不一致则不通过 二.以jenkins登陆界面为例,代码如下 fr ...
- 大型企业都在用的Python反爬虫手段,破了它!
SVG 映射反爬虫 很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手.很多已经做案例的人,却不知道如何去学习更加高深的知识.那么针对这三类人 ...
- 【HTML基础习题】HTML5+CSS3做问卷星登录页面
源代码下载地址:https://download.csdn.net/download/weixin_44893902/12839539 码云仓库地址: https://gitee.com/ynavc/ ...
随机推荐
- 剑指offer二刷——数组专题——数组中重复的数字
题目描述 在一个长度为n的数组里的所有数字都在0到n-1的范围内. 数组中某些数字是重复的,但不知道有几个数字是重复的.也不知道每个数字重复几次.请找出数组中任意一个重复的数字. 例如,如果输入长度为 ...
- JApiDocs(自动生成接口文档神器)
JApiDocs教程 前言 作为一名优秀的程序员来说,由于涉及到要与前端进行对接,所以避免不了的就是写接口文档.写完接口文档,一旦代码返回结果,参数等出现变动,接口文档还得随之改动,十分麻烦,违背了我 ...
- SpringBoot快速入门(实战篇一)
SpringBoot快速入门(一) 一SpringBoot简介 1.spring开发经历的阶段 Spring 诞生时是 Java 企业版(Java Enterprise Edition,JEE,也称 ...
- 五、testNG异常处理
当程序出现异常或者测试中有异常测试案例可以使他抛出异常 例如:0不可以当做除数,如果将除数设置为0会抛出异常 在testNG上加上 expectedExceptions = ArithmeticExc ...
- NFS文件共享服务器搭建
环境准备 centos 7.x+ 两台 192.168.40.128(用作NFS服务端) 192.168.40.129(用作NFS客户端) NFS服务端部署(192.168.40.128 机器上面执行 ...
- 系统类 字符串String类
java编程语言中的字符串. 在java中,String类是不可变的,对String类的任何改变,都是返回一个新的String类对象. String 对象是 System.Char 对象的有序集合,用 ...
- react第二单元(react的组件-state-props-setState)
第二单元(react的组件-state-props-setState) 课程目标 理解组件和组件的创建.以及能够根据实际场景去划分合理的组件. 理解并且能够灵活的应用组件中的state.props. ...
- js--数组的filter()过滤方法的使用
前言 你还在通过for循环遍历数组吗?你还在遍历之后一项一项的通过if判断过滤你需要的数据吗?你还在写着一大堆代码实现一个简单的过滤数据功能吗?那么,今天他来了.他就是这里要介绍的es6中数组filt ...
- "Date has wrong format. Use one of these formats instead: %, Y, -, %, m, -, %, d." DateField使用input_formats参数
错误写法 : publish_date = serializers.DateField(format="%Y-%m-%d", input_formats="%Y-%m-% ...
- 如何使用Pytest进行自动化测试
为什么需要自动化测试 自动化测试有很多优点,但这里有3个主要的点 可重用性:不需要总是编写新的脚本,除非必要,即使是新的操作系统版本也不需要编写脚本. 可靠性:人容易出错,机器不太可能.当运行不能跳过 ...