自动网页截图并指定元素位置裁剪图片并保存到excel表格

# coding=utf-8

import os

import time

from selenium import webdriver

from selenium.webdriver.chrome.options import Options

from selenium.webdriver.common.by import By

from selenium.webdriver.support import expected_conditions as EC

from selenium.webdriver.support.wait import WebDriverWait

from PIL import Image

import xlsxwriter, xlrd

import pandas as pd

def login():

    chrome_options = Options()

    chrome_options.add_argument('--headless')

    driver = webdriver.Chrome(executable_path='./chromedriver', chrome_options=chrome_options)

    driver.set_window_size(1200, 741)

    driver.implicitly_wait(2)

    print('初始化中...')

    driver.get("http://xxxve")

    print('填写登录信息中...')

    acc = driver.find_element_by_id('login-email')

    pwd = driver.find_element_by_id('login-pass')

    btn = driver.find_element_by_tag_name('button')

    acc.send_keys('zhxxxm')

    pwd.send_keys('LONxxxxx$')

    btn.click()

    print('跳转到验证码页面中...')

    time.sleep(2)

    capta = driver.find_element_by_id('code')

    capta_input = input('请输入两步验证码：')

    capta.send_keys(capta_input)

    btn1 = driver.find_element_by_tag_name('button')

    btn1.click()

    time.sleep(2)

    print('跳转到创意编辑页面中...')

    return driver

faild_url = []

def parse_img(driver, url):

    cid = url.split('/')[-2]

    try:

        driver.get_screenshot_as_file("./screen_shot/{}.png".format(cid))

        element = driver.find_element_by_class_name("AdvertViewer-item")

        # print(element.location)  # 打印元素坐标

        # print(element.size)  # 打印元素大小

        left = element.location['x']

        top = element.location['y']

        right = element.location['x'] + element.size['width']

        bottom = element.location['y'] + element.size['height']

        im = Image.open("./screen_shot/{}.png".format(cid))

        im = im.crop((left, top, right, bottom))

        im.save("./screen_shot/{}.png".format(cid))

        print("创意-->{}.png 已经保存".format(cid))

    except Exception as e:

        faild_url.append(url)

def get_screen(driver, url, tem):

    try:

        driver.get(url)

        time.sleep(10)

        parse_img(driver,url)

    except Exception as e:

        print(e, url)

        faild_url.append(url)

def new_xlsx():

    # 打开excel文件

    data = xlrd.open_workbook('全xxx意.xlsx')

    book = xlsxwriter.Workbook('全行xxx意-fina.xlsx')

    # 获取第一张工作表（通过索引的方式）

    tables = data.sheets()

    for table in tables:

        worksheet = book.add_worksheet(table.name)

        nrows = table.nrows

        # 表头

        rows = table.row_values(0)

        for i, v in enumerate(rows):

            if v != '':

                worksheet.write(0, i, v)

        # 表体

        for k in range(1, nrows - 1):

            rows = table.row_values(k)

            for i, v in enumerate(rows):

                if v != '':

                    if str(int(rows[6])) + '.png' in os.listdir('./screen_shot/'):

                        image_width, image_height = Image.open('./screen_shot/' + str(int(rows[6])) + '.png').size

                        worksheet.set_column('H:H', width=58)

                        worksheet.set_row(k, height=image_height*0.8)

                        if i == 7:

                            worksheet.insert_image('H' + str(k + 1), './screen_shot/' + str(int(rows[6])) + '.png',

                                                   {'x_offset': 6, 'y_offset': 3})

                        else:

                            worksheet.write(k, i, v)

                    else:

                        worksheet.write(k, i, v)

    book.close()

if __name__ == '__main__':

    df = pd.read_excel('./全行xxxx.xlsx')

    driver1 = login()

    link_list = df['link'].tolist()

    tem_list = df['样式'].tolist()

    dict_url = zip(link_list, tem_list)

    for url, tem in dict_url:

        count = 1

        get_screen(driver1, url, tem)

        count += 1

        print('还剩 %s 个' % str(len(link_list) - count))

    driver1.quit()

    print('失败的url:', faild_url)

    print('所有抓取结束')

    new_xlsx()

    print('插入表格结束')

自动网页截图并指定元素位置裁剪图片并保存到excel表格的更多相关文章

jquery操作滚动条滚动到指定元素位置 scrollTop
$('.brand_t a').bind('click',function(){ if($(this).attr('title1')){ var toChar = $(this).attr('titl ...
JavaScript 滚动页面到指定元素位置
页面评论功能,当评论较多时,有时须要滚动到评论头部. 能够使用scrollTop方法,加上一点延时动画(animate),可訪问在线演示,代码大体例如以下: <html> <scri ...
winform中RichTextBox在指定光标位置插入图片
代码如下: //获取RichTextBox控件中鼠标焦点的索引位置 int startPosition = this.richTextBox1.SelectionStart; //从鼠标焦点处开始选中 ...
MYSQL 为表指定文件位置 data directory
背景知识: 如果表不指定文件位置,它会保存到 data/database_name/table_file;其中data在你指定的安装目录下,为了提高IO我们尽可能的用到多个硬盘的IO能力,这个就需要 ...
使用JS方法使页面滚动到指定元素+优化+API介绍（动画）
前言当页面最上部有顶部菜单是,使用锚点跳转的方法很容易挡住想要呈现的内容(如下图技能两个字被挡住了一半),为避免出现这样的问题,故滚动到指定元素使用用JS的方法来实现. 目录使用的API简介初版 ...
利用 Python + Selenium 实现对页面的指定元素截图(可截长图元素)
对WebElement截图 WebDriver.Chrome自带的方法只能对当前窗口截屏,且不能指定特定元素.若是需要截取特定元素或是窗口超过了一屏,就只能另辟蹊径了. WebDriver.Phant ...
html2canvas根据DOM元素样式实现网页截图
html2canvas是一个相当不错的JavaScript类库,它使用了html5和css3的一些新功能特性,实现了在客户端对网页进行截图的功能.html2canvas通过获取页面的DOM和元素的样 ...
如何使页面滚动条移动到指定元素element的位置处？
如何使页面滚动条移动到指定元素element的位置处? 在用selenium做测试时,会遇到需要操作的元素不在当前可视页面中的情况,如果是手工测试,自然很简单,手动拖拽滚动条到目标元素处即可. 那么, ...
滚动到指定元素的id处+当元素出现在浏览器显示区域就会自动加载
//滚动到指定元素的id处如:$("#Exam82") function Jump() { var scroll_offset = $("#Exam82"). ...

随机推荐

Mqtt paho 回调函数触发机制跟踪
Python Mqtt paho 回调函数触发机制跟踪,我使用的是 buildroot 里面的 mqtt paho , 代码在 ''' buildroot-2017.02.8/output/build ...
springMVC和struts2有什么不同？为什么要用springMVC或者struts2？让你实现一个MVC框架大概如何设计？
[问题一:不同] (1)框架机制 1.Struts2采用Filter(StrutsPrepareAndExecuteFilter)实现,SpringMVC(DispatcherServlet)则采用S ...
vue 框架安装系列问题
npm install --global vue-cli 错误提示:vue-cli-service' 不是内部或外部命令,也不是可运行的程序或批处理文件解决:如果是npm安装的执行 npm -g b ...
[LeetCode] 12. Integer to Roman 整数转为罗马数字
Roman numerals are represented by seven different symbols: I, V, X, L, C, D and M. Symbol Value I 1 ...
[LeetCode] 81. Search in Rotated Sorted Array II 在旋转有序数组中搜索 II
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this ...
[LeetCode] 217. Contains Duplicate 包含重复元素
Given an array of integers, find if the array contains any duplicates. Your function should return t ...
python使用consul进行服务注册和发现
阅读目录一.安装启动consul 二.python服务注册三.golang服务注册四.通过API的方式获取信息回到顶部一.安装启动consul 1.通过docker快速安装 #获取docke ...
spring跨重定向传递数据
spring跨重定向传递数据为何要重定向? 作用之一:防止表单重复提交如何重定向? // 在控制器方法返回的视图名称中,以redirect:开头的String不是用来查找视图的,而是用来指导浏览器 ...
select2的使用
普通的select不支持搜索,当选项很多的时候,需要一个个下拉查找. 有了select2就方便多了下载 <https://select2.org/> 引入 <link href=& ...
python学习-65 继承2-子类中调用父类的方法
子类中调用父类的方法 1.子类继承了父类的方法,然后想进行修改,那么就需要在子类中调用父类的方法. 2.方法一:父类名 class School: Country = 'china' def __in ...

自动网页截图并指定元素位置裁剪图片并保存到excel表格

自动网页截图并指定元素位置裁剪图片并保存到excel表格的更多相关文章

随机推荐

热门专题