#coding=utf-8
from time import sleep
import unittest
from selenium import webdriver
from selenium.webdriver import Remote
from selenium.webdriver.common.by import By#元素定位
import sys

def browser():#启动浏览器驱动
    #driver = webdriver.Ie()
    driver = Remote(command_executor='http://127.0.0.1:4444/wd/hub',
                                                desired_capabilities={'platform':'ANY',
                                                                      'browserName':'firefox',
                                                                      'version':'',
                                                                     })
    return driver

class MyTest(unittest.TestCase):#框架

    def setUp(self):
        print("开始执行用例!")
        self.driver = browser()
        self.driver.implicitly_wait(10)
        self.driver.maximize_window()

    def tearDown(self):
        self.driver.quit()
        print('用例执行结束!')
        
class Page(object):#基础类
    '''
    页面基础类,用于所有页面的继承
    '''
    bbs_url = 'http://www.pm25.com/shanghai.html'
    
    def __init__(self,selenium_driver,base_url=bbs_url,parent=None):#初始化
        self.base_url = base_url
        self.driver = selenium_driver
        self.timeout = 30
        self.parent = parent
    
    def on_page(self):#断言url是否相等
        return self.driver.current_url == (self.base_url + self.url)
        
    def _open(self,url):
        url = self.base_url + url
        self.driver.get(url)
        assert self.on_page(),'获取的url和当前url不匹配.url:%s' % url
          
    def open(self):#打开浏览器  
        self._open(self.url)
    
    def find_element(self,*loc):#单个元素定位
        return self.driver.find_element(*loc)
    
    def find_elements(self,*loc):#多个元素定位
        return self.driver.find_elements(*loc)
    

class PM25(Page):#页面对象封装
    u'''豆瓣读书排序'''
    url = '/'
    #元素定位
    bbs_city_loc = (By.XPATH,'//div/div[1]/h2')#城市名称
    bbs_pmindex_loc = (By.XPATH,'//div[6]/div/div[3]/div[1]/a')#PM2.5指数
    #元素封装
    def bbs_city(self):#城市名称
        cityname = []       
        pmurls = ['http://www.pm25.com/shanghai.html','http://www.pm25.com/beijing.html','http://www.pm25.com/shenzhen.html','http://www.pm25.com/guangzhou.html']
        for i in pmurls:
            self.driver.get(i)
            _input = self.driver.find_elements(*self.bbs_city_loc)# 选择页面上所有的tag name 为input 的元素
            for j in _input:
                cityname.append(j.text)#取出值并添加到数组
            else:
                sleep(1)
        return cityname
        
    
    def bbs_pm25(self):#城市指数
        citypm25 = []       
        pmurls = ['http://www.pm25.com/shanghai.html','http://www.pm25.com/beijing.html','http://www.pm25.com/shenzhen.html','http://www.pm25.com/guangzhou.html']
        for i in pmurls:
            self.driver.get(i)
            _input = self.driver.find_elements(*self.bbs_pmindex_loc)# 选择页面上所有的tag name 为input 的元素
            for j in _input:
                citypm25.append(int(j.text))#取出值并添加到数组
            else:
                sleep(1)
        return citypm25
        
    
    def out_node(self):#排序
        list1 = self.bbs_city()
        list2 = self.bbs_pm25()
        list = dict(zip(list1,list2))#(map(lambda x,y:[x,y], list1,list2))       
        print("list:%s"%list)
        dict1= sorted(list.items(),key=lambda item:item[1])#从小到大排序
        print('从小到大排序:%s'%dict1)
        return dict1
    
    def writetxt(self):#写入txt文件
        a = self.out_node()
        b = list(a)
        for c in b:
            b[b.index(c)] = list(c)#将元组内嵌列表转换为列表
        print(b)
        d = [ str(i) for i in b ]#将所有int类型转换为str类型
        print(d)
        f1 = open('a.txt','w')
        for i in d:#循环读取内嵌列表
            print(i)#分别打印内嵌列表里的列表
            f1.writelines(i)#写入txt文件
            f1.write('\n')#写入文件时换行
        f1.close()
          
class test_Douban_film(MyTest):
    u'''pm2.5排序'''
    
    def test1(self):
        u'''pm2.5排序并写入txt文件'''
        p1 = PM25(self.driver)
        p1.open()
        p1.writetxt()

if __name__ == '__main__':
    unittest.main()

使用page object模式抓取几个主要城市的pm2.5并从小到大排序后写入txt文档的更多相关文章

  1. 一个简易的Python爬虫,将爬取到的数据写入txt文档中

    代码如下: import requests import re import os #url url = "http://wiki.akbfun48.com/index.php?title= ...

  2. 搭建谷歌浏览器无头模式抓取页面服务,laravel->php->python->docker !!!

    背景: 公司管理系统需要获取企业微信页面的配置参数如企业名.logo.人数等信息并操作,来隐藏相关敏感信息并自定义简化企业号配置流程 第一版已经实现了扫码登录获取cookie,使用该cookie就能获 ...

  3. 【C#|.NET】从细节出发(三) 逻辑层事务和page object模式

    一. 业务逻辑层的事务问题 如果你的程序分层清晰并且系统禁用复杂存储过程,那么在DA中的职责比较单一.程序的逻辑通过BLL调用各种不同模块的DA来实现数据操作.如果当需要不同模块在一个事务的时候,问题 ...

  4. selenium page object模式

    页面对象模式将测试代码和被测试页面的元素及操作进行分离,以降低页面元素的变化对测试代码的影响.每个被测试的页面都会被定义一个类,类中会定位元素和操作. 如果不使用page object模式,则相同的操 ...

  5. 转 Page Object模式

    Page Object模式是Selenium中的一种测试设计模式,主要是将每一个页面设计为一个Class,其中包含页面中需要测试的元素(按钮,输入框,标题 等),这样在Selenium测试页面中可以通 ...

  6. UI自动化测试的Page Object模式

    在UI级的自动化测试框架中,当页面样式改变或者页面元素属性改变,那么代码也要随之进行修改,如何做到高效快速的修改代码来适应这些改变呢,这个时候可以引入Page Object模式,也是页面对象设计模式. ...

  7. 网络抓取功能实现 将获取的结果进行过滤并写入到TXT文档中

    下面是自己编写的 网络抓取功能实现 将获取的结果进行过滤并写入到TXT文档中 (以防忘记) 原创哟 import java.io.BufferedReader;import java.io.Buffe ...

  8. 浅析selenium的page object模式

    selenium目前比较流行的设计模式就是page object,那么到底什么是page object呢,简单来说,就是把页面作为对象,在使用中传递页面对象,来使用页面对象中相应的成员或者方法,能更好 ...

  9. Page Object 模式编写UiAutomator脚本

    在我们学习Page Object Model之前,我们先了解一下Page Object Model(以下简称POM). 为什么要POM 用UiAutomator启动UI自动化测试不是一件困难的任务.你 ...

随机推荐

  1. Java 时间类-Calendar、Date、LocalDate/LocalTime

    1.Date 类 java.util.Date是一个"万能接口",它包含日期.时间,还有毫秒数,如果你只想用java.util.Date存储日期,或者只存储时间,那么,只有你知道哪 ...

  2. python10作业思路及源码:类Fabric主机管理程序开发(仅供参考)

    类Fabric主机管理程序开发 一,作业要求 1, 运行程序列出主机组或者主机列表(已完成) 2,选择指定主机或主机组(已完成) 3,选择主机或主机组传送文件(上传/下载)(已完成) 4,充分使用多线 ...

  3. Mysql 忘记root密码处理办法

    一.更改my.cnf配置文件 1.用命令编辑/etc/my.cnf配置文件,即:vim /etc/my.cnf 或者 vi /etc/my.cnf 2.在[mysqld]下添加skip-grant-t ...

  4. 札记:Java异常处理

    异常概述 程序在运行中总会面临一些"意外"情况,良好的代码需要对它们进行预防和处理.大致来说,这些意外情况分三类: 交互输入 用户以非预期的方式使用程序,比如非法输入,不正当的操作 ...

  5. Lesson 23 A new house

    Text I had a letter from my sister yesterday. She lives in Nigeria. In her letter, she said that she ...

  6. ES6+ 现在就用系列(一):为什么使用ES6+

    系列目录 ES6+ 现在就用系列(一):为什么使用ES6+ ES6+ 现在就用系列(二):let 命令 ES6+ 现在就用系列(三):const 命令 ES6+ 现在就用系列(四):箭头函数 => ...

  7. API Monitor简介(API监控工具)

    API Monitor是一个免费软件,可以让你监视和控制应用程序和服务,取得了API调用. 它是一个强大的工具,看到的应用程序和服务是如何工作的,或跟踪,你在自己的应用程序的问题. 64位支持 API ...

  8. 使用Rest访问Redis中的数据

    原创文章转载请注明出处:@协思, http://zeeman.cnblogs.com   大家在用Redis保存数据的时候,有不同的序列化方式.用得最多应该还是JSON,有一些场景我们需要以Http请 ...

  9. ASP.NET Web API Model-ActionBinding

    ASP.NET Web API Model-ActionBinding 前言 前面的几个篇幅把Model部分的知识点划分成一个个的模块来讲解,而在控制器执行过程中分为好多个过程,对于控制器执行过程(一 ...

  10. ASP.NET MVC 视图(三)

    ASP.NET MVC 视图(三) 前言 上篇对于Razor视图引擎和视图的类型做了大概的讲解,想必大家对视图的本身也有所了解,本篇将利用IoC框架对视图的实现进行依赖注入,在此过程过会让大家更了解的 ...