潭州课堂25班：Ph201805201 爬虫基础第十二课点触验证码二 (课堂笔记）

为上次代码添加模拟人操作的鼠标的移动轨迹

# -*- coding:utf-8 -*-

# 斌彬电脑

# @Time :   2018/9/14 0014    上午 8:08

from selenium import webdriver

from selenium.webdriver.support.wait import WebDriverWait

from selenium.webdriver.chrome.options import Options

from selenium.webdriver.support import expected_conditions as EC

from selenium.webdriver import ActionChains     # 动作链

from selenium.webdriver.common.by import By

import requests,re

from PIL import Image

from io import BytesIO      # 不写入磁盘，显示图片文件

import time

from chao_ji_yin import Chaojiying_Client          # 超级鹰

class WanYy():

    def __init__(self, user, pas):

        # 浏览器参数

        self.user = user

        self.pas = pas

        options = Options()

        options.add_argument('--window-size=1366,768')

        self.dri = webdriver.Chrome(chrome_options=options)

        self.wait = WebDriverWait(self.dri, 10)

    def get_start(self):

        # 请求网页

        self.dri.get('http://dun.163.com/trial/picture-click')

        # 下拉页面

        self.dri.execute_script('window.scrollTo(0, 500)')

    def get_image(self):

        #  点击按键，显示验证码

        #  获取验证码 图片

        self.wait.until(EC.presence_of_element_located((By.XPATH, '/html/body/main/div/div/div[2]/div[2]/div[2]/div/div[2]/div[3]/div/div/div[2]/div[3]/span[2]'))).click()

        #  等待加载完成 截图

        # time.sleep(2)

        # 验证码位置

        im = self.wait.until(EC.visibility_of_element_located((

            By.XPATH, '/html/body/main/div/div/div[2]/div[2]/div[2]/div/div[2]/div[3]/div/div/div[1]/div/div[1]/img[1]'

        )))  # 异步  比 time.sleep 好

        im1 = BytesIO(self.dri.get_screenshot_as_png())

        # Image.open(im).show()

        im2 = Image.open(im1)

        #                     浏览器的左上角坐标     -500 因为下滑了500，

        window_im = im2.crop((im.location['x'], im.location['y']-500,im.location['x']+310, im.location['y']+210-500))

        # window_im.show()

        im_data = BytesIO()

        window_im.save(im_data, format('png'))

        # 返回图片 二进制 数据

        return im_data.getvalue()

    # 调用超级鹰 识别验证码

    def post_validation_participation(self,im_data ):

        # 实例化 超级鹰

        chao = Chaojiying_Client(self.user, self.pas, '897271')

        data = chao.PostPic(im_data, '9103')      # 超级鹰反回的 json 数据

        data = data.get('pic_str')

        data_list = [i.split(',') for i in data.split('|')]   #  验证码图片上第个字的坐标

        # print(data_list)

        return data_list

      # 得到位置信息，进行点击

    def click_word(self, data_list):

        # 验证码位置 ,节点

        im = self.wait.until(EC.visibility_of_element_located((

            By.XPATH, '/html/body/main/div/div/div[2]/div[2]/div[2]/div/div[2]/div[3]/div/div/div[1]/div/div[1]/img[1]'

        )))

        #  根据节点移动鼠标

        # 移到第一个字位置

        ActionChains(self.dri).move_to_element_with_offset(im, int(data_list[0][0]), int(data_list[0][1])).perform()

        #  点击

        ActionChains(self.dri).click().perform()

        time.sleep(1)

        #       传入第一个位置 和 第二个字位置

        for i in self.track(data_list[0], data_list[1]):

        # 移到第二个字位置

            ActionChains(self.dri).move_to_element_with_offset(im, int(i[0]), int(i[1])).perform()

            # ActionChains(self.dri).move_to_element_with_offset(im, int(data_list[1][0]), int(data_list[1][1])).perform()

            #  点击

        ActionChains(self.dri).click().perform()

        time.sleep(1)

        # for i in self.track(data_list[1], data_list[2]):

        for i in self.track(data_list[1], data_list[2]):

            # 移到第三个字位置

            ActionChains(self.dri).move_to_element_with_offset(im, int(i[0]), int(i[1])).perform()

            # ActionChains(self.dri).move_to_element_with_offset(im, int(data_list[2][0]), int(data_list[2][1])).perform()

            #  点击

        ActionChains(self.dri).click().perform()

    # #  鼠标移动轨迹 模拟人操作点击

    def track(self, last_p, next_p):

        # 接收上个字的位置和下个字的位置

        # 鼠标移动轨迹列表

        position_list=[]

        #  字间的距离分成 20 分

        x = (int(next_p[0]) - int(last_p[0])) / 20

        y = (int(next_p[1]) - int(last_p[1])) / 20

        for i in range(1,21):

            # 走 20 步小步

            position = [round(x*i) + int(last_p[0]), round(y*i) + int(last_p[1])]

            position_list.append(position)

        return position_list

    #  像函数一样调用

    def __call__(self, *args, **kwargs):

        self.get_start()

        imdata = self.get_image()

        da_list = self.post_validation_participation(imdata)

        print(da_list)

        self.click_word(da_list)

        # time.sleep(5)

        # self.dri.close()

if __name__ == '__main__':

    yedun = WanYy('超级鹰账号', '密码')

    yedun()

第一个字位置直接给位置，执行点击，

之后第二，第三个字调用 track 方法

在 track 方法中算出第一个字与第二个字的距离，之后分成 20 步执行，到达下个字的位置，进行点击

在此之上的基础上，记录鼠标移动轨迹，存放在图片 a.png 中

# -*- coding:utf-8 -*-

# 斌彬电脑

# @Time :   2018/9/15 0015    上午 10:52

from selenium import webdriver

from selenium.webdriver.support.wait import WebDriverWait

from selenium.webdriver.chrome.options import Options

from selenium.webdriver.support import expected_conditions as EC

from selenium.webdriver import ActionChains     # 动作链

from selenium.webdriver.common.by import By

import requests,re

from PIL import Image

from io import BytesIO      # 不写入磁盘，显示图片文件

import time

from chao_ji_yin import Chaojiying_Client          # 超级鹰

class WanYy():

    def __init__(self, user, pas):

        # 浏览器参数

        self.user = user

        self.pas = pas

        options = Options()

        options.add_argument('--window-size=1366,768')

        self.dri = webdriver.Chrome(chrome_options=options)

        self.wait = WebDriverWait(self.dri, 10)

        self.window_im = None

    def get_start(self):

        # 请求网页

        self.dri.get('http://dun.163.com/trial/picture-click')

        # 下拉页面

        self.dri.execute_script('window.scrollTo(0, 500)')

    def get_image(self):

        #  点击按键，显示验证码

        #  获取验证码 图片

        self.wait.until(EC.presence_of_element_located((By.XPATH, '/html/body/main/div/div/div[2]/div[2]/div[2]/div/div[2]/div[3]/div/div/div[2]/div[3]/span[2]'))).click()

        #  等待加载完成 截图

        # time.sleep(2)

        # 验证码位置

        im = self.wait.until(EC.visibility_of_element_located((

            By.XPATH, '/html/body/main/div/div/div[2]/div[2]/div[2]/div/div[2]/div[3]/div/div/div[1]/div/div[1]/img[1]'

        )))  # 异步  比 time.sleep 好

        im1 = BytesIO(self.dri.get_screenshot_as_png())

        # Image.open(im1).show()

        im2 = Image.open(im1)

        #                     浏览器的左上角坐标     -500 因为下滑了500，

        self.window_im = im2.crop((im.location['x'], im.location['y']-500,im.location['x']+310, im.location['y']+210-500))

        # window_im.show()

        im_data = BytesIO()

        self.window_im.save(im_data, format('png'))

        # 返回图片 二进制 数据

        return im_data.getvalue()

    # 调用超级鹰 识别验证码

    def post_validation_participation(self,im_data ):

        # 实例化 超级鹰

        chao = Chaojiying_Client(self.user, self.pas, '897271')

        data = chao.PostPic(im_data, '9103')      # 超级鹰反回的 json 数据

        data = data.get('pic_str')

        data_list = [i.split(',') for i in data.split('|')]   #  验证码图片上第个字的坐标

        # print(data_list)

        return data_list

      # 得到位置信息，进行点击

    def click_word(self, data_list):

        # 验证码位置 ,节点

        img = self.window_im.convert('L')

        datami = img.load()  # 图片数据重构

        im = self.wait.until(EC.visibility_of_element_located((

            By.XPATH, '/html/body/main/div/div/div[2]/div[2]/div[2]/div/div[2]/div[3]/div/div/div[1]/div/div[1]/img[1]'

        )))

        #  根据节点移动鼠标

        # 移到第一个字位置

        ActionChains(self.dri).move_to_element_with_offset(im, int(data_list[0][0]), int(data_list[0][1])).perform()

        #  点击

        ActionChains(self.dri).click().perform()

        time.sleep(1)

        #       传入第一个位置 和 第二个字位置

        for i in self.track(data_list[0], data_list[1]):

        # 移到第二个字位置

        #     print(datami[int(i[0]), int(i[1])])

            if datami[int(i[0]), int(i[1])] > 125:

                datami[int(i[0]), int(i[1])] = 0

                datami[int(i[0])-1, int(i[1])-1] = 0

                datami[int(i[0])-2, int(i[1])-2] = 0

                datami[int(i[0])+1, int(i[1])+1] = 0

                datami[int(i[0])+2, int(i[1])+2] = 0

            else:

                datami[int(i[0]), int(i[1])] = 255

                datami[int(i[0])-1, int(i[1])-1] = 255

                datami[int(i[0])-2, int(i[1])-2] = 255

                datami[int(i[0])+1, int(i[1])+1] = 255

                datami[int(i[0])+2, int(i[1])+2] = 255

            ActionChains(self.dri).move_to_element_with_offset(im, int(i[0]), int(i[1])).perform()

            # ActionChains(self.dri).move_to_element_with_offset(im, int(data_list[1][0]), int(data_list[1][1])).perform()

            #  点击

        ActionChains(self.dri).click().perform()

        time.sleep(1)

        for i in self.track(data_list[1], data_list[2]):

            if datami[int(i[0]), int(i[1])] > 125:

                datami[int(i[0]), int(i[1])] = 0

                datami[int(i[0])-1, int(i[1])-1] = 0

                datami[int(i[0])-2, int(i[1])-2] = 0

                datami[int(i[0])+1, int(i[1])+1] = 0

                datami[int(i[0])+2, int(i[1])+2] = 0

            else:

                datami[int(i[0]), int(i[1])] = 255

                datami[int(i[0])-1, int(i[1])-1] = 255

                datami[int(i[0])-2, int(i[1])-2] = 255

                datami[int(i[0])+1, int(i[1])+1] = 255

                datami[int(i[0])+2, int(i[1])+2] = 255

            # 移到第三个字位置

            ActionChains(self.dri).move_to_element_with_offset(im, int(i[0]), int(i[1])).perform()

            # ActionChains(self.dri).move_to_element_with_offset(im, int(data_list[2][0]), int(data_list[2][1])).perform()

            #  点击

        ActionChains(self.dri).click().perform()

        img.save('a.png')

    # #  鼠标移动轨迹 模拟人操作点击

    def track(self, last_p, next_p):

        # 接收上个字的位置和下个字的位置

        # 鼠标移动轨迹列表

        position_list=[]

        #  字间的距离分成 20 分

        x = (int(next_p[0]) - int(last_p[0])) / 20

        y = (int(next_p[1]) - int(last_p[1])) / 20

        for i in range(1,21):

            # 走 20 步小步

            position = [round(x*i) + int(last_p[0]), round(y*i) + int(last_p[1])]

            position_list.append(position)

        return position_list

    #  像函数一样调用

    def __call__(self, *args, **kwargs):

        self.get_start()

        imdata = self.get_image()

        da_list = self.post_validation_participation(imdata)

        print(da_list)

        self.click_word(da_list)

        # time.sleep(5)

        # self.dri.close()

if __name__ == '__main__':

    yedun = WanYy('账号', '密码')

    yedun()

潭州课堂25班：Ph201805201 爬虫基础第十二课点触验证码二 (课堂笔记）的更多相关文章

潭州课堂25班：Ph201805201 爬虫基础第十五课 js破解二 (课堂笔记）
PyExecJs使用 PyExecJS是Ruby的ExecJS移植到Python的一个执行JS代码的库. 安装 pip install PyExecJS 例子 >>> import ...
潭州课堂25班：Ph201805201 爬虫基础第十四课 js破解 (课堂笔记）
打断点找要的数据鼠标的点击事件新浪微博登录表单提交分析 : 先佃输入错误密码开始调式 f10 往下走, f11 进入函数 sh + f11 跳出函数 # -*- coding: utf-8 - ...
潭州课堂25班：Ph201805201 爬虫基础第十课图像处理- 极验验证码 (课堂笔记）
用 python 的 selenium 访问 https://www.huxiu.com/ 自动通过验证码 # -*- coding: utf-8 -*- # 斌彬电脑 # @Time : 20 ...
潭州课堂25班：Ph201805201 django 项目第十五课用户注册功能后台实现 (课堂笔记）
前台:判断用户输入 ,确认密码,手机号, 一切通过后向后台发送请求, 请求方式:post 在 suers 应用下的视图中: 1,创建个类, 2,创建 GET 方法,宣言页面 3,创建 POST 方法 ...
潭州课堂25班：Ph201805201 WEB 之页面编写第四课登录注册 (课堂笔记)
index.html 首页 <!DOCTYPE html> <html lang="en"> <head> <meta charset=& ...
潭州课堂25班：Ph201805201 WEB 之页面编写第三课 (课堂笔记)
index.html <!DOCTYPE html> <html lang="en"> <head> <meta charset=&quo ...
潭州课堂25班：Ph201805201 WEB 之页面编写第二课 (课堂笔记)
index.html <!DOCTYPE html> <html lang="en"> <head> <meta charset=&quo ...
潭州课堂25班：Ph201805201 WEB 之页面编写第一课 (课堂笔记)
index.html <!DOCTYPE html> <html lang="en"> <head> <meta charset=&quo ...
潭州课堂25班：Ph201805201 第十课类的定义，属性和方法 (课堂笔记)
类的定义共同属性,特征,方法者,可分为一类,并以名命之 class Abc: # class 定义类, 后面接类名 ( 规则首字母大写 ) cls_name = '这个类的名字是Abc' # 在类 ...

随机推荐

Andrew Ng在coursera上的ML视频知识点笔记（2）
一.由线性回归导出逻辑回归: 二.“一对多”算法解决多分类问题: 三.“过拟合”和“欠拟合”: (1)对线性回归加入正则项: (2)对逻辑回归加入正则项: (3)加入正则项之后的正规方程:
[转]HEX文件格式解析
1.前言本文主要讲述keil MDK 下STM32编译生成的的HEX镜像文件格式.并说明镜像load地址是如何添加进HEX文件的. 2.keil MDK如何在HEX文件中添加load addr 通过 ...
linux添加定时任务crond
1.crontab –e:编辑当前定时任务保存完重新crond : service crond restart 2. crontab用法 crontab –e : 修改 crontab 文件,如果文 ...
mybatis异常分析jdbcType
Exception in thread "main" org.springframework.jdbc.UncategorizedSQLException: Error setti ...
学习笔记(三)--->《Java 8编程官方参考教程（第9版）.pdf》:第十章到十二章学习笔记
回到顶部注:本文声明事项. 本博文整理者:刘军本博文出自于: <Java8 编程官方参考教程>一书声明:1:转载请标注出处.本文不得作为商业活动.若有违本之,则本人不负法律责任.违法 ...
vue路径优化之resolve
通过vue-cli来创建vue+webpack的项目时,已经有很多都配置好了,但是路径方面为了方便开发,还可以优化. 1. resolve.extensions 在webpack.base.conf. ...
node版本控制之nvm
windows下安装nvm 用nvm-noinstall.zip安装 1.nvm是个啥?nvm是一个可以让你在同一台机器上安装和切换不同版本node的工具linux系统的github地址:点我如果你是 ...
JQuery 插件一般方法
如今做web开发,jquery 几乎是必不可少的,就连vs神器在2010版本开始将Jquery 及ui 内置web项目里了.至于使用jquery好处这里就不再赘述了,用过的都知道.今天我们来讨论下jq ...
hdu3530 双单调队列的维护
单调队列有部分堆的功能,但其只能维护给定区间中比v大的值或者比v小的值,且其一般存储元素的下标. 思路:两个单调队列维护最大值与最小值的下标,如果区间的最大值最小值之差大于给定范围,则选择队首靠左的删 ...
（第5篇）避免协作冲突--简单易接入的Zookeeper
摘要: 众所周知,分布式的系统协作服务很难有让人满意的产品.这些协作服务产品很容易陷入一些诸如竞争选择条件或者死锁的陷阱中.那Zookeeper又是怎么解决这个问题的呢? 博主福利给大家推荐一套ha ...

潭州课堂25班：Ph201805201 爬虫基础 第十二课 点触验证码二 (课堂笔记）

潭州课堂25班：Ph201805201 爬虫基础 第十二课 点触验证码二 (课堂笔记）的更多相关文章

随机推荐

热门专题

潭州课堂25班：Ph201805201 爬虫基础第十二课点触验证码二 (课堂笔记）

潭州课堂25班：Ph201805201 爬虫基础第十二课点触验证码二 (课堂笔记）的更多相关文章