盖得化工--selenium翻页测试

Python爬虫视频教程零基础小白到scrapy爬虫高手-轻松入门

https://item.taobao.com/item.htm?spm=a1z38n.10677092.0.0.482434a6EmUbbW&id=564564604865

以下结果还是费时，尝试reques4,bs4模块

# -*- coding: utf-8 -*-

"""

Created on Mon May  9 09:14:32 2016

@author: Administrator

"""

import requests,bs4,csv,time,selenium,random

from selenium import webdriver

from selenium.webdriver.common.keys import Keys

site_hubei="http://china.guidechem.com/suppliers/list_catid-21_area-%E6%B9%96%E5%8C%97"

pages_hubei=31

#所有公司的链接网址_存储列表

list_corporation_link=[]

def Get_sites(site,pages):

    list_pages=[]

    for page in range(1,pages+1):

        thePage=site+"-"+"p"+str(page)+".html"

        list_pages.append(thePage)

    return list_pages

#采集一页所有公司的二级网址

def Get_corporation_site():

    elems=browser.find_elements_by_class_name("dblue")

    links_list=[i.get_attribute("href") for i in elems]

    return links_list 

#构造所有湖北页面网址

list_pages_hubei=Get_sites(site_hubei,pages_hubei)

#打开浏览器

browser=webdriver.Firefox()

#获取首页

browser.get(list_pages_hubei[0])

#测试获取前十页公司的二级网址

for i in range(1,10):

    links_list=Get_corporation_site()

    list_corporation_link.append(links_list)

    #翻下一页

    page_elem=browser.find_element_by_name("PageNum")

    browser.find_element_by_name("PageNum").clear()  #清除输入文本框的文字

    pageNum=str(i+1)

    page_elem.send_keys(pageNum)   #输入进入第三页

    page_elem.send_keys(Keys.RETURN)

#测试速度太慢，主要是反复调用browser.get(page)

'''

[['http://show.guidechem.com/hbsthcsales/',

  'http://show.guidechem.com/whdinghuichem/',

  'http://show.guidechem.com/hbeixys2001/',

  'http://show.guidechem.com/jusheng/',

  'http://show.guidechem.com/yongnuopharm/',

  'http://show.guidechem.com/gameboy0820/',

  'http://show.guidechem.com/whhxk/',

  'http://show.guidechem.com/zhuoxinghy/',

  'http://show.guidechem.com/nrcaocao/',

  'http://show.guidechem.com/hbxyhhgwy/',

  'http://show.guidechem.com/jushengkeji/',

  'http://show.guidechem.com/jushengchem4/',

  'http://show.guidechem.com/eva1210/',

  'http://show.guidechem.com/whdhwy/',

  'http://show.guidechem.com/chenjinping2014/',

  'http://show.guidechem.com/hbjltchem/',

  'http://show.guidechem.com/jlt7796/',

  'http://show.guidechem.com/saichuang123/',

  'http://show.guidechem.com/apidky/',

  'http://show.guidechem.com/finetechwh/'],

 ['http://show.guidechem.com/csw288/',

  'http://show.guidechem.com/cuizhiying123/',

  'http://show.guidechem.com/sjpxkj/',

...........

  ttp://show.guidechem.com/hengshuochem/',

  'http://show.guidechem.com/DSHKJYXGS/',

  'http://show.guidechem.com/HUBEIBOKAI/',

  'http://show.guidechem.com/xiangdetech/']]

'''

盖得化工--selenium翻页测试的更多相关文章

（java）selenium webdriver学习---实现简单的翻页，将页面内容的标题和标题链接取出
selenium webdriver学习---实现简单的翻页,将页面内容的标题和标题链接取出: 该情况适合能能循环page=1~n,并且每个网页随着循环可以打开的情况, 注意一定是自己拼接的url可以 ...
万能js实现翻页，动态生成内容自动翻页，兼容各种浏览器（已测试）----神器版！
转--http://www.2cto.com/kf/201402/277535.html 万能js实现翻页,动态生成内容自动翻页,兼容各种浏览器(已测试)----神器版! 2014-02-11 ...
Web测试——翻页功能测试用例
参考:https://wenku.baidu.com/view/e6462707de80d4d8d15a4f1e.html?rec_flag=default&mark_pay_doc=2&am ...
python 使用selenium模块爬取同一个url下不同页的内容（浏览器模拟人工翻页）
页面翻页,下一页可能是一个新的url 也有可能是用js进行页面跳转,url不变,解决方法是实现浏览器模拟人工翻页目标:爬取同一个url下不同页的数据(上述第二种情况) url:http://www. ...
selenium 之百度搜索，结果列表翻页查询
selenium之百度搜索,结果列表翻页查询 by:授客 QQ:1033553122 实例:百度搜索,结果列表翻页查询解决问题:解决selenium driver获取web页面元素时,元素过期问题 ...
用fiddler测试移动端翻页
大家在移动端是怎么测试翻页的,肯定都是下拉或上滑吧,我也是这样测试的但如果你要验证数据是否与pc端数据一致时,可能是第一页,第二页看看,或最后几页数据看看,在pc端看简单,直接点击最后一页就行,在移 ...
C# 自动翻页 PPT 测试脚本
本文告诉大家一个可以使用的 C# 脚本,可以用来自动打开 PPT 文件,然后不断执行翻页.每次翻页都截图.翻页之后自动关闭 PPT 再次打开最近发现给 Office 做的插件,会在一定翻页次数的时候 ...
selenium模块跳过用户名密码验证码输入，加载浏览器标签和cookie，进行翻页爬虫多页动态加载的数据（js)
能解决登陆一次后,之后不需要二次登陆的动态加载数据,网页保存的cookie和标签,加入到selenium自动化测试浏览器中 1 from selenium import webdriver 2 imp ...
盖得化工----requests/bs4---采集二级网址
Python爬虫视频教程零基础小白到scrapy爬虫高手-轻松入门 https://item.taobao.com/item.htm?spm=a1z38n.10677092.0.0.482434a6E ...

随机推荐

TestSushu1
https://github.com/jzjaerui/Individual-Project/blob/master/TestSushu1 <程序设计实践I> 题目: ...
JavaScript封装方法，兼容参数类型为Number和String
/** * 依据Kind确定跳转到目标列表页面. * @param kind */ function gobackByKind(kind) { var kindStr = String(kind); ...
Java和Android的Lru缓存，及其实现原理
一.概述 Android提供了LRUCache类,可以方便的使用它来实现LRU算法的缓存.Java提供了LinkedHashMap,可以用该类很方便的实现LRU算法,Java的LRULinkedHas ...
Spring学习14-源码下载地址
今天想下载一下Spring的源代码,登录到Spring官网,傻眼了,根本找不到下载的地方!费了九牛二虎之力在网上找到了一个下载地址,记下来,免得下次再次傻找. http://s3.amazonaws. ...
liunx速查
文件和目录 Linux 主要目录速查表 /:根目录,一般根目录下只存放目录,在 linux 下有且只有一个根目录,所有的东西都是从这里开始当在终端里输入 /home,其实是在告诉电脑,先从 /(根目 ...
BZOJ5178[Jsoi2011]棒棒糖——主席树
题目描述 Coffee的世界里也是有棒棒糖卖的,Coffee买了N(1≤N≤50000)只连着的.这N只棒棒糖包裹在小塑料袋中,排成一列,相邻的两只棒棒糖的塑料袋是接起来的.为了方便,我们把棒棒糖从 ...
Sublime Text3配置及控制台乱码[cmd杀死进程乱码/编译文件乱码]解决方法
[NodeJs] 1.安装 http://nodejs.cn/download/ 2.安装过程省略(因为已经安装过了) 和平时安装软件没区别 3.配置环境计算机--->属性-->高级系统 ...
Hadoop 入门
我看过的比较全的文章.赞一下原文链接:http://www.aboutyun.com/thread-8329-1-1.html 问题导读: 1.hadoop编程需要哪些基础?2.hadoop编程需要 ...
mvc Filters 过滤器
项目需要控制controller和action的访问权限. 看了下资料,发觉还是很方便的. 首先在mvc项目下创建一个文件夹 Filters, 然后在Filters中创建一个类.代码如下 namesp ...
Java监听器Listener的使用详解
监听器用于监听Web应用中某些对象的创建.销毁.增加,修改,删除等动作的发生,然后作出相应的响应处理.当监听范围的对象的状态发生变化的时候,服务器自动调用监听器对象中的方法.常用于统计网站在线人数.系 ...

盖得化工--selenium翻页测试

盖得化工--selenium翻页测试的更多相关文章

随机推荐

热门专题