使用po模式读取豆瓣读书最受关注的书籍，取出标题、评分、评论、题材按评分从小到大排序并输出到txt文件中

#coding=utf-8
from time import sleep
import unittest
from selenium import webdriver
from selenium.webdriver import Remote
from selenium.webdriver.common.by import By#元素定位
import sys

def browser():#启动浏览器驱动
    '''
    driver = Remote(command_executor='http://127.0.0.1:4444/wd/hub',
                                                desired_capabilities={'platform':'ANY',
                                                                      'browserName':'chrome',
                                                                      'version':'',
                                                                     })'''
    driver = webdriver.Ie()
    return driver

class MyTest(unittest.TestCase):#框架

    def setUp(self):
        print("开始执行用例！")
        self.driver = browser()
        self.driver.implicitly_wait(10)
        self.driver.maximize_window()

    def tearDown(self):
        self.driver.quit()
        print('用例执行结束！')

class Page(object):#基础类
    '''
    页面基础类，用于所有页面的继承
    '''
    bbs_url = 'https://book.douban.com/'

    def __init__(self,selenium_driver,base_url=bbs_url,parent=None):#初始化
        self.base_url = base_url
        self.driver = selenium_driver
        self.timeout = 30
        self.parent = parent

    def on_page(self):#断言url是否相等
        return self.driver.current_url == (self.base_url + self.url)

    def _open(self,url):
        url = self.base_url + url
        self.driver.get(url)
        assert self.on_page(),'获取的url和当前url不匹配.url:%s' % url

    def open(self):#打开浏览器
        self._open(self.url)

    def find_element(self,*loc):#单个元素定位
        return self.driver.find_element(*loc)

    def find_elements(self,*loc):#多个元素定位
        return self.driver.find_elements(*loc)


class Douban_film(Page):#页面对象封装
    u'''豆瓣读书排序'''
    url = '/'
    #元素定位
    bbs_booknum_loc = (By.XPATH,'//li/div[2]/p[1]/span[2]')#评分
    bbs_bookname_loc = (By.XPATH,'//li/div[2]/h4/a')#书名
    bbs_bookauther_loc = (By.XPATH,'//li/div[2]/p[2]')#作者
    bbs_booktype_loc = (By.XPATH,'//li/div[2]/p[3]')#类型
    bbs_bookcomments_loc = (By.XPATH,'//li/div[2]/p[5]')#评论
    #元素封装
    def bbs_bookname(self):#豆瓣评分
        _input = self.driver.find_elements(*self.bbs_bookname_loc)# 选择页面上所有的tag name 为input 的元素
        bookname = []
        for i in _input:
            bookname.append(i.text)#取出值并添加到数组
        else:
            sleep(1)
        return bookname

    def bbs_booknum(self):#豆瓣评分
        _input = self.driver.find_elements(*self.bbs_booknum_loc)# 选择页面上所有的tag name 为input 的元素
        booknum = []
        for i in _input:
            booknum.append(i.text)#取出值并添加到数组
        else:
            sleep(1)
        return booknum

    def bbs_bookauther(self):#作者
        _input = self.driver.find_elements(*self.bbs_bookauther_loc)# 选择页面上所有的tag name 为input 的元素
        bookauther = []
        for i in _input:
            bookauther.append(i.text)#取出值并添加到数组
        else:
            sleep(1)
        return bookauther

    def bbs_booktype(self):#类型
        _input = self.driver.find_elements(*self.bbs_booktype_loc)# 选择页面上所有的tag name 为input 的元素
        bookautype = []
        for i in _input:
            bookautype.append(i.text)#取出值并添加到数组
        else:
            sleep(1)
        return bookautype

    def bbs_bookcomments(self):#评论
        _input = self.driver.find_elements(*self.bbs_bookcomments_loc)# 选择页面上所有的tag name 为input 的元素
        bookaucomments = []
        for i in _input:
            bookaucomments.append(i.text)#取出值并添加到数组
        else:
            sleep(1)
        return bookaucomments

    def out_node(self):#排序
        list1 = self.bbs_booknum()
        list2 = self.bbs_bookname()
        list3 = self.bbs_bookauther()
        list4 = self.bbs_booktype()
        list5 = self.bbs_bookcomments()
        list = [[a,b,c,d,e] for a,b,c,d,e in zip(list1,list2,list3,list4,list5)]
        team = list[:]
        team.sort()
        print('从小到大排序：%s'%team)
        return team

    def writetxt(self):#写入txt文件
        a = self.out_node()
        f1 = open('b.txt','w',encoding='utf-8')#写入文件编码格式，不写的话有时候会导致解析错误
        for i in a:#循环读取内嵌列表
            #if isinstance(i,list):#判断是否是一个列表
            print(i)#分别打印内嵌列表里的列表
            f1.writelines(i)#写入txt文件
            f1.write('\n')#写入文件时换行
        f1.close()

class test_Douban_film(MyTest):
    u'''豆瓣读书排序'''

    def test1(self):
        u'''豆瓣评分按降序排列并保存到txt文件'''
        p1 = Douban_film(self.driver)
        p1.open()
        p1.writetxt()

if __name__ == '__main__':
    unittest.main()

使用po模式读取豆瓣读书最受关注的书籍，取出标题、评分、评论、题材按评分从小到大排序并输出到txt文件中的更多相关文章

按行读取TXT文件中的内容
public Dictionary<int, string> GetDicFromLog() { try { StreamReader sr = new StreamReader(file ...
从txt文件中读取数据放在二维数组中
1.我D盘中的test.txt文件内的内容是这样的,也是随机产生的二维数组 /test.txt/ 5.440000 3.4500006.610000 6.0400008.900000 3.030000 ...
读取同一文件夹下多个txt文件中的特定内容并做统计
读取同一文件夹下多个txt文件中的特定内容并做统计有网友在问,C#读取同一文件夹下多个txt文件中的特定内容,并把各个文本的数据做统计. 昨晚Insus.NET抽上些少时间,来实现此问题,加强自身的 ...
SQL C# nvarchar类型转换为int类型多表查询的问题，查询结果到新表，TXT数据读取到控件和数据库，生成在控件中的数据如何存到TXT文件中
在数据库时候我设计了学生的分数为nvarchar(50),是为了在从TXT文件中读取数据插入到数据库表时候方便,但是在后期由于涉及到统计问题,比如求平均值等,需要int类型才可以,方法是:Conver ...
Java中读取txt文件中中文字符时，出现乱码的解决办法
这是我写的一个Java课程作业时,遇到的问题. 问题描述: 我要实现的就是将txt文件中的内容按一定格式读取出来后,存放在相应的数组. 我刚开始运行时发现,英文可以实现,但是中文字符就是各种乱码. 最 ...
Flex读取txt文件中的内容（三）
Flex读取txt文件中的内容 1.设计源码 LoadTxt.mxml: <?xml version="1.0" encoding="utf-8"?> ...
Flex读取txt文件中的内容（二）
Flex读取txt文件中的内容自动生成的文件 LoadTxt-app.xml: <?xml version="1.0" encoding="utf-8" ...
Flex读取txt文件中的内容（一）
Flex读取txt文件中的内容 phone.txt: 13000003847 13000003848 13000003849 13000003850 13000003851 13000003852 1 ...
Flex读取txt文件中的内容报错
Flex读取txt文件中的内容 1.具体错误如下 2.错误原因读取文件不存在 var file:File = new File(File.applicationDirectory.nativePat ...

随机推荐

网络原因导致 npm 软件包 node-sass / gulp-sass 安装失败的处理办法
如果你正在构建一个基于 gulp 的前端自动化开发环境,那么极有可能会用到 gulp-sass ,由于网络原因你可能会安装失败,因为安装过程中部分细节会到亚马逊云服务器上获取文件.本文主要讨论在不变更 ...
ASP.NET Aries 入门开发教程2：配置出一个简单的列表页面
前言: 朋友们都期待我稳定地工作,但创业公司若要躺下,也非意念可控. 若人生注定了风雨飘摇,那就雨中前行了. 最机开始看聊新的工作机会,欢迎推荐,创业公司也可! 同时,趁着自由时间,抓紧把这系列教程给 ...
高大上的微服务可以很简单，使用node写微服务
安装 npm install m-service --save 使用编写服务处理函数 // dir1/file1.js // 使用传入的console参数输出可以自动在日志里带上request id ...
尝试asp.net mvc 基于controller action 方式权限控制方案可行性
微软在推出mvc框架不久,短短几年里,版本更新之快,真是大快人心,微软在这种优秀的框架上做了大量的精力投入,是值得赞同的,毕竟程序员驾驭在这种框架上,能够强力的精化代码,代码层次也更加优雅,扩展较为方 ...
Java多态性——分派
一.基本概念 Java是一门面向对象的程序设计语言,因为Java具备面向对象的三个基本特征:封装.继承和多态.这三个特征并不是各自独立的,从一定角度上看,封装和继承几乎都是为多态而准备的.多态性主要体 ...
使用HttpClient的优解
新工作入职不满半周,目前仍然还在交接工作,适应环境当中,笔者不得不说看别人的源码实在是令人痛苦.所幸今天终于将大部分工作流畅地看了一遍,接下来就是熟悉框架技术的阶段了. 也正是在看源码的过程当中,有一 ...
移动应用App测试与质量管理一
测试工程师基于Html的WebApp测试, 现在一些移动App混Html5 HTML5性能测试兼容性整理后的脑图测试招聘弱化大量技术考察看重看问题的高度看重潜力测试经验质量管理专项 ...
org.jboss.deployment.DeploymentException: Trying to install an already registered mbean: jboss.jca:service=LocalTxCM,name=egmasDS
17:34:37,235 INFO [Http11Protocol] Starting Coyote HTTP/1.1 on http-0.0.0.0-8080 17:34:37,281 INFO [ ...
使用github远程仓库
经过几天对github的研究,终于把自己想完成的给解决了,发现google真的有很多解释,但是很多也会出现一些bug,对于初学者真的很多烦恼,所以整理一份,能给初识github的你有所帮助一,首先, ...
Android中Activity的四大启动模式实验简述
作为Android四大组件之一,Activity可以说是最基本也是最常见的组件,它提供了一个显示界面,从而实现与用户的交互,作为初学者,必须熟练掌握.今天我们就来通过实验演示,来帮助大家理解Activ ...

使用po模式读取豆瓣读书最受关注的书籍，取出标题、评分、评论、题材 按评分从小到大排序并输出到txt文件中