selenium,webdriver,xpath获取全国各地的邮编

代码要多敲注释要清晰

其中区号没有拿取出来

看到的朋友可以作为练习

,有好的方法可以在下面留言

from selenium import webdriver

from lxml import etree

import time

#接口分析

# base_url = 'http://www.ip138.com/post/'

# base_url = 'http://www.ip138.com/51/'

#生成浏览器

driver = webdriver.PhantomJS()

#拿取邮编信息函数

def youbian(num):

    #各地的接口url地址

    base_url = 'http://www.ip138.com/%s/'%(num)

    #访问

    driver.get(base_url)

    #把页面生成树结构

    tree = etree.HTML(driver.page_source)

    #用xpath拿取想要的数据

    trs = tree.xpath('//table[@class="t12"]/tbody/tr[@bgcolor="#ffffff"]')

    for tr in trs:

        #地区和邮编的拿取

        diqu = tr.xpath('.//b')

        if diqu != []:

            diqu = diqu[0].text

            number = tr.xpath('.//td/a')

            number = number[1].text

        else:

            diqu = tr.xpath('.//td')[0].text

            number = tr.xpath('.//td/a')

            number = number[0].text

        #打印出想要的结果

        print(diqu,'邮编:' + number)

#主进程

if __name__ == '__main__':

    #各地的接口号

    num = [

        10,30,50,3,1,11,13,15,20,21,31,23,35,33,25,

        45,43,41,51,53,57,40,61,55,65,85,71,73,81,75,83

    ]

    #遍历接口号 一个一个的传输

    for n in num:

        youbian(n)

'''

树结构分析

tr:市区

<tr bgcolor="#ffffff">

    <td>

        <a href="guangzhou/">

            <b>广州市</b>

        </a>

    </td>

    <td>

        <a href="/510000/">510000</a>

    </td>

    <td>

        <a href="/020/">020</a>

    </td>

    <td colspan="3">&nbsp;</td>

</tr>

#地区

<tr bgcolor="#ffffff">

    <td>通县</td>

    <td>

        <a href="/101100/">101100</a>

    </td>

    <td>

        <a href="/010/">010</a>

    </td>

</tr>

'''

selenium,webdriver,xpath获取全国各地的邮编的更多相关文章

selenium webdriver XPath的定位方法练习！
html 代码: <html> <body> <div id="div1"> <input name="divl1input& ...
selenium webdriver——XPath 定位
baidu.html代码如下 ....<form id="form" class="fm" action="/s" name=&quo ...
Selenium Webdriver——Xpath轴定位(preceding)
1.preceding-sibling 选取当前节点之前的所有同级节点 text=出发之前的同级节点: 2.preceding 选取当前节点开始标签之前的所有节点 text=出发节点标签之前的所有i ...
Python3 Selenium WebDriver网页的前进、后退、刷新、最大化、获取窗口位置、设置窗口大小、获取页面title、获取网页源码、获取Url等基本操作
Python3 Selenium WebDriver网页的前进.后退.刷新.最大化.获取窗口位置.设置窗口大小.获取页面title.获取网页源码.获取Url等基本操作通过selenium webdr ...
（java）selenium webdriver学习，选择模块，点击下一页，获取当前url
selenium webdriver学习,选择模块,点击下一页,获取当前url 查找下一页有多种方法,这里列举两种: isSelected()函数用于判断是否点击选中,返回Boolean类型 impo ...
selenium webdriver 右键另存为下载文件（结合robot and autoIt）
首先感谢Lakshay Sharma 大神的指导最近一直在研究selenium webdriver右键菜单,发现selenium webdriver 无法操作浏览器右键菜单,如图如果我想右键另存为 ...
Selenium的PO模式（Page Object Model）|(Selenium Webdriver For Python)
研究Selenium + python 自动化测试有近两个月了,不能说非常熟练,起码对selenium自动化的执行有了深入的认识. 从最初无结构的代码,到类的使用,方法封装,从原始函数 ...
Selenium WebDriver 处理table
首先,html table是由 table 元素以及一个或多个 tr.th 或 td 元素组成. for example: 这是一个简单的html table: 源码如下: <html> ...
Selenium WebDriver 处理cookie
在使用webdriver测试中,很多地方都使用登陆,cookie能够实现不必再次输入用户名密码进行登陆. 首先了解一下Java Cookie类的一些方法. 在jsp中处理cookie数据的常用方法: ...

随机推荐

《剑指offer》面试题4 替换空格 Java版
(给一个足够长的字符数组,其中有一段字符,将' '(空格)替换成'%' '2' '0'三个字符,原字符段由'\0'结尾) 书中方法:这道题如果从头到尾扫描数组并替换,会涉及到数组的移动.如果不移动元素 ...
ADC（简易的DMA传输）的认识
ADC(简易的DMA传输)的认识首先看到是ADC的特性 1.ADC的12位分辨率.不能直接测量负电压,然后是最小量程化单位是LSB=Vref+/212 2.单次和转换模式的使用 3. 从通道0到通道 ...
windows下nvm的安装及使用
由于更新了npm版本之后导致npm的命令都会报错,一顿百度,明白了nvm可以管理node版本的,下面是操作过程: 如果在安装nvm之前已经下载了node 需要把node卸载!!! 需要把node卸载! ...
无法删除VMware旧版本，请与技术小组联系
问题:把文件夹清理了n遍,却无法重装VMware,报错如标题. 原因:相关注册表没删完. 解决办法: - 1.创建一个.txt文本 - 2.将下面的内容复制到.txt文本中: echo off cls ...
YouCompleteMe报错可能是第三方库没有
git submodule update --init --recursive 到YouCompleteMe安装目录下,执行上面的命令
IDA Pro - 如何得到比较清楚的逆向伪代码
原文地址:Question about disassembler 简介这篇文章介绍了如何在不使用插件的IDA Hex-Rays如何得到比较清晰的伪代码.IDA Hex-Rays功能很强大,只要你提供 ...
VS基本教程
首先打开vs,点击工具栏,文件----新建----项目然后依次选择Visual C++----空项目-----命名---项目存放路径接下来在解决方案资源管理器中选中源文件,右键----添加---- ...
通过URL方式动态修改logback level级别
import org.slf4j.Logger; import org.slf4j.LoggerFactory; import ch.qos.logback.classic.Level; import ...
Swagger添加文件上传测试
先上对比图图一无法选择文件,图二可以选择文件图一图二添加过滤器 public class SwaggerFileUploadFilter : IOperationFilter { /// &l ...
spring boot与ElasticSearch的集成
本文主要介绍Spring boot与ElasticSearch的集成,因为Spring boot的教程以及ElasticSearch的学习其他博客可能更优秀,所以建议再看这篇文章前先学习学习一下Spr ...

selenium,webdriver,xpath获取全国各地的邮编

selenium,webdriver,xpath获取全国各地的邮编的更多相关文章

随机推荐

热门专题