selenium+chromedriver刷点击量

#coding=utf-8

import re

import time

import json

import requests

from selenium import webdriver

from selenium.common.exceptions import TimeoutException

from selenium.webdriver.common.by import By

from selenium.webdriver.support.ui import WebDriverWait

from selenium.webdriver.support import expected_conditions as EC

URL = u'www.baidu.com'

def get_http_proxy_from_pool():

    proxy = {}

    try:

        url = "xxxxxxxxxxxxxxxxxxxxxxxxxx"

        response = requests.get(url)

        jsonstr = response.text

        result = json.loads(jsonstr)

        if result.get("code") == 1:

            proxy_list = result.get("data")

            proxy_item = proxy_list[0]

            proxy = {"http":"http://%s:%s"%(proxy_item.get("proxy_ip"),proxy_item.get("proxy_port"))}

        else:

            raise Exception("failed to get http proxy.")

    except Exception as e:

        print str(e)

    finally:

        return proxy

def get_desired_capabilities():

    proxy = get_http_proxy_from_pool().get(u"http")

    print u"当前代理: %s" % proxy

    options = webdriver.ChromeOptions()

    desired_capabilities = options.to_capabilities()

    desired_capabilities[u'proxy'] = {

                                    u"httpProxy": proxy,

                                    u"ftpProxy": proxy,

                                    u"sslProxy": proxy,

                                    u"noProxy": None,

                                    u"proxyType": u"MANUAL",

                                    u"class": u"org.openqa.selenium.Proxy",

                                    u"autodetect": False}

    return desired_capabilities

def get_chrome_browser():

    desired_capabilities = get_desired_capabilities()

    browser = webdriver.Chrome(desired_capabilities = desired_capabilities)

    return browser

def get_headless_chrome_browser():

    chrome_options = webdriver.ChromeOptions()

    chrome_options.add_argument('headless')

    desired_capabilities = get_desired_capabilities()

    browser = webdriver.Chrome(desired_capabilities = desired_capabilities, chrome_options=chrome_options)

    return browser

def search_keyword(keyword):

    browser = get_headless_chrome_browser()

    #设置超时时间

    wait = WebDriverWait(browser, 5)

    try:

        browser.get(URL)

        #等待搜索框与搜索按钮加载完成

        input = wait.until(EC.presence_of_element_located((By.ID, u'searchKey')))

        input.send_keys(keyword)

        button = wait.until(EC.element_to_be_clickable((By.ID, u'btn-search')))

        button.click()

        print u"%s搜索成功" % keyword

    except Exception as e:

        print(u'搜索过程出错')

    finally:

        browser.delete_all_cookies()

        browser.close()

def main():

    results = get_company_from_mysql()

    for result in results:

        keyword = result[0] if result else ""

        print keyword

        search_keyword(keyword)

        time.sleep(1)

if __name__=='__main__':

    main()

selenium+chromedriver刷点击量的更多相关文章

Python一日一练05----怒刷点击量
功能自己主动获取CSDN文章列表,并对每篇文章添加点击量. 源代码 import urllib.request import re import time import random from bs ...
ASP.NET MVC WebApi 返回数据类型序列化控制（json,xml) 用javascript在客户端删除某一个cookie键值对 input点击链接另一个页面，各种操作。 C# 往线程里传参数的方法总结 TCP/IP 协议用C#+Selenium+ChromeDriver 生成我的咕咚跑步路线地图 (转)值得学习百度开源70+项目
ASP.NET MVC WebApi 返回数据类型序列化控制(json,xml) 我们都知道在使用WebApi的时候Controller会自动将Action的返回值自动进行各种序列化处理(序列化为 ...
python通过代理刷网页点击量
python通过代理刷网页点击量更新异常处理情况 @time 2013-0803 更新循环里计数问题和随机等待时间问题 #!/usr/bin/python #-*- coding:utf-8 -*- ...
用C#+Selenium+ChromeDriver 生成我的咕咚跑步路线地图
先上结果: 之前在公司业务中用过java+Selenium+ChromeDriver ,使用起来非常顺手,可以完美模拟真实的用户浏览行为.最近休息的时候想用C#也试一下,于是有了本文. 实现原理一样 ...
selenium + ChromeDriver 实战系列之启信宝（一）
之前写了一篇selenium + ChromeDriver的一些入门的知识,这篇博客里面找了启信宝这个网站,简单的进行了一个实战练习.本篇博客的结构如下: 首先会给出一些使用seleniu ...
phpcms文章点击量统计方法
phpcms用户广大,很好用,很傻瓜.设计思路也很好,对cms的常见功能都有设计,可以作为自己开发的参考. 最近看了下phpcms的源码关于文章点击量统计的这块,自己记录下. 默认文章点击量显示的位置 ...
PHPCMS V9 栏目列表调用文章点击量及评论数量方法
很多朋友在用Phpcms做站时,具体需要在列表页.首页调用文章列表调用文章的点击量和评论排行,那么怎么才能做到在Phpcms v9首页.频道页.列表页.推荐位等页面获取文章浏览量和评论统计呢? 原因起 ...
PHPCMS V9 点击量排行调用方法
首先调用的标签代码如下: {pc:content action=”sitehits” siteid=”4″ num=”10″ order=”views DESC” cache=”3600″} {loo ...
.net 新闻点击量修改，避免恶意刷新
DataTable dt = bll.GetNewsByID(id);//根据ID获取的新闻详细内容 if (dt != null && dt.Rows.Count > 0) { ...

随机推荐

Java基础知识总结--多态
面向对象编程的三大特性:封装.继承.多态封装隐藏了类的内部实现机制,可以在不影响使用的情况下改变类的内部结构,同时也保护了数据,而外界而已它的内部细节是隐藏的,暴露给外界的只是它的访问方法. 继承是 ...
python之类和对象
对象(object)基本上可以看做数据(特性)以及由一系列可以存取.操作这些数据的方法所组成的集合. 类,可以看成种类,类型,从一组对象中提取到的相似部分.所有的对象都属于一个类,称为类的实例. 之前 ...
JS_高程3.基本概念（4）操作符
ECMA-262用于操作数据值的操作符包括: 算术操作符位操作符关系操作符相等操作符 ECMAScript操作符的不同之处在于:它能够适用于很多值,包括字符串,数字值,布尔值,甚至是对象.(在应 ...
【倍增】Tak and Hotels II @ABC044&ARC060/upcexam6463
6463: Tak and Hotels II 时间限制: 1 Sec 内存限制: 128 MB 题目描述 N hotels are located on a straight line. The ...
u-boot-2018-09 分析 v1
下载地址: https://pan.baidu.com/s/1YcQ1XpFyzmNcr1afw1RhgQ 或者:
java 规则引擎资料汇集
1. ibm的developworks中较早的一篇关于规则引擎的文章 https://www.ibm.com/developerworks/cn/java/j-java-rules/ 2. 一篇硕士论 ...
webview 向右滑动关闭时，怎么禁止此 webview 上下滚动?
webview 向右滑动关闭时,怎么禁止此 webview 上下滚动?
Java Lambda 表达式对 Map 对象排序
Map<String,String> mailParams = new LinkedHashMap<>(); mailParams.put("Action" ...
QIDO-RS - Search
6.7.1 QIDO-RS - Search 6.7.1.1 Request The specific resources to be used for the search actions shal ...
linux平台下Tomcat的安装与优化
Tomcat 服务器是一个免费的开放源代码的Web 应用服务器,属于轻量级应用服务器,在中小型系统和并发访问用户不是很多的场合下被普遍使用,是开发和调试JSP 程序的首选.对于一个初学者来说,可以这样 ...

selenium+chromedriver刷点击量

selenium+chromedriver刷点击量的更多相关文章

随机推荐

热门专题