前段时间做ui自动化测试的时候,导航栏菜单始终有点问题,最后只好直接获取到url,然后直接使用driver.get(url)进入页面;

包括做压测的时候,比如我要找出所有报表菜单的url,这样不可能手动去一个一个找出来,然后复制,这样浪费时间,并且也容易漏掉,所以我就写了个脚本来干这事;

首先说下思路:登录-->获取所有的a标签-->筛选掉不用的标签-->打印或者保存到文件中

其中我获取页面所有的标签使用了两种方法,webdriver和beautifulsoup4,两种的区别:1、beautifulsoup4来解析的时候,比较稳定,并且速度快,2、webdriver可能简单一点吧,我推荐是用beautifulsoup4;之所以是用webdriver登录,是因为用webdriver登录简单,不像requests来请求的话,第一次还要分析url,参数之类的,用webdriver的话,只需要定位几个元素就ok了,何乐而不为呢。。。

下面我将两种方式的运行时间、最终的解析结果:

下面的是第一种方式:使用beautifulsoup4来解析:

 #coding=utf-8

 """
是为了获取XXX系统菜单的url
使用的是selenium登录,获取网页的内容,然后用beautifulsoup来解析
"""
import unittest
import time
from selenium import webdriver
from bs4 import BeautifulSoup # 登录url
url = 'http://XXXX.XXXX.com/' # 系统的url
username = 'XXXX'
password = 'XXXXX' class GetUrl(unittest.TestCase):
def setUp(self):
self.dr = webdriver.Chrome()
self.dr.get(url) def tearDown(self):
self.dr.quit() def _login(self):
self.dr.find_element_by_id('username').send_keys(username) # 输入用户名
self.dr.find_element_by_id('password').send_keys(password) # 输入密码
# self.dr.find_element_by_id('verifycode').send_keys('XXXXX') 这里原来是需要验证码的,后来取消掉了
self.dr.find_element_by_id('weblogin').click() # 点击登录按钮
time.sleep(3) def _gethtmlcontent(self):
"""获取当前页面的html的所有内容"""
content = self.dr.page_source # 将该页面的内容 返回给content保存起来方便后面解析
return content def _geturl(self,pagesource):
"""
找出所有的a标签,然后筛选掉非导航连接的a标签。返回的是一个dict
"""
result = dict()
soup = BeautifulSoup(pagesource, "lxml")
eles = soup.find_all("a")
flag = 0
for ele in eles:
if '#' in ele['href']:
continue
tmp = ele.string
if tmp is not None and '@' not in tmp:
flag += 1
ele_url = ele['href'].split('?')[0]
# print('{0} ==> {1}'.format(tmp,ele_url))
result[tmp] = ele_url # print('Find out {0} datas.'.format(len(result)))
return result def _writetotxt(self,contents):
"""
将结果写入文件中
"""
print('写入开始')
with open('urlcontent.txt','w') as f:
for title,value in contents.items():
f.write('{0} ==> {1}\n'.format(title,value))
print('写入完毕') def test_run(self):
self._login()
pagesources = self._gethtmlcontent()
result = self._geturl(pagesources)
self._writetotxt(result) if __name__ == '__main__':
unittest.main()

第二种全都是使用webdriver来解析的:

 #coding=utf-8

 """
是为了获取XXX系统菜单的url
使用的是selenium登录,查找元素,获取元素的属性
"""
from selenium import webdriver
import unittest
import time # 登录url
url = 'http://XXX.XXX.com/'
username = 'XXX'
password = 'XXX' class GetUrl(unittest.TestCase):
def setUp(self):
self.dr = webdriver.Chrome()
self.dr.get(url) def tearDown(self):
self.dr.quit() def _login(self):
# time.sleep(2)
self.dr.find_element_by_id('username').send_keys(username)
self.dr.find_element_by_id('password').send_keys(password)
# self.dr.find_element_by_id('verifycode').send_keys('XXXXX')
self.dr.find_element_by_id('weblogin').click()
time.sleep(3) def _geturl(self):
      # 这里返回的是一个list,然后里面是一个个字典
result = list()
eles = self.dr.find_elements_by_css_selector('menu.u-menu a')
for ele in eles:
tmp = dict()
href = ele.get_attribute('href').split('?')[0]
# 获取菜单 的名称
name = ele.get_attribute('innerHTML')
if "<i>" not in name:
tmp['name'] = name.strip()
tmp['href'] = href
result.append(tmp)
# print('name: {0},href: {1}'.format(name,href))
return result def _writetotxt(self,contents):
print("一共{0}条数据".format(len(contents)))
print('写入开始')
with open('urlcontent.txt','w') as f:
for content in contents:
f.write('{0} ==> {1}\n'.format(content['name'],content['href']))
print('写入完毕') def test_run(self):
self._login()
self._writetotxt(self._geturl()) if __name__ == '__main__':
unittest.main()

好了,就到这里吧。。。

解析导航栏的url--selnium,beautifulsoup实战的更多相关文章

  1. 解析导航栏的url

    前段时间做ui自动化测试的时候,导航栏菜单始终有点问题,最后只好直接获取到url,然后直接使用driver.get(url)进入页面: 包括做压测的时候,比如我要找出所有报表菜单的url,这样不可能手 ...

  2. day77:luffy:导航栏的实现&DjangoRestFramework JWT&多条件登录

    目录 1.导航栏的实现 2.登录前戏:用户表初始化 3.DjangoRestFramework JWT 4.多条件登录 5.登录状态的判断和退出登录 1.导航栏的实现 1.设计导航栏的model模型类 ...

  3. Android ActionBar完全解析,使用官方推荐的最佳导航栏(下) .

    转载请注明出处:http://blog.csdn.net/guolin_blog/article/details/25466665 本篇文章主要内容来自于Android Doc,我翻译之后又做了些加工 ...

  4. Html5 学习笔记 【PC固定布局】 实战2 导航栏搜索区域

    <!DOCTYPE html> <html lang="zh-cn"> <head> <meta charset="UTF-8& ...

  5. Html5 学习笔记 【PC固定布局】 实战1 导航栏

    导航栏html文件: <!DOCTYPE html> <html lang="zh-cn"> <head> <meta charset=& ...

  6. Android ActionBar完全解析,使用官方推荐的最佳导航栏(上)

    转载请注明出处:http://blog.csdn.net/guolin_blog/article/details/18234477 本篇文章主要内容来自于Android Doc,我翻译之后又做了些加工 ...

  7. Android ActionBar全然解析,使用官方推荐的最佳导航栏(上)

    转载请注明出处:http://blog.csdn.net/guolin_blog/article/details/18234477 本篇文章主要内容来自于Android Doc.我翻译之后又做了些加工 ...

  8. 【转】Android ActionBar完全解析,使用官方推荐的最佳导航栏(上)

    转载请注明出处:http://blog.csdn.net/guolin_blog/article/details/18234477 本篇文章主要内容来自于Android Doc,我翻译之后又做了些加工 ...

  9. Bootstrap 学习笔记 项目实战 响应式导航栏

    导航代码HTML: <!DOCTYPE html> <html lang="zh-cn"> <head> <meta charset=&q ...

随机推荐

  1. Java多线程13:读写锁和两种同步方式的对比

    读写锁ReentrantReadWriteLock概述 大型网站中很重要的一块内容就是数据的读写,ReentrantLock虽然具有完全互斥排他的效果(即同一时间只有一个线程正在执行lock后面的任务 ...

  2. 设计模式之美:Manager(管理器)

    索引 意图 结构 参与者 适用性 效果 实现 实现方式(一):Manager 模式的示例实现. 意图 将对一个类的所有对象的管理封装到一个单独的管理器类中. 这使得管理职责的变化独立于类本身,并且管理 ...

  3. Ubuntu Desktop开发生产环境搭建

    Ubuntu Desktop开发生产环境搭建 1   开发生产环境搭建 在本节内容开始前,先定义一下使用场合,没有哪种系统或者设备是万能的,都有它的优点和缺点,能够在具体的使用场景,根据自身的需求来取 ...

  4. 如何设计一门语言(八)——异步编程和CPS变换

    关于这个话题,其实在(六)里面已经讨论了一半了.学过Haskell的都知道,这个世界上很多东西都可以用monad和comonad来把一些复杂的代码给抽象成简单的.一看就懂的形式.他们的区别,就像用js ...

  5. 风筝的C++随时记

    关于常量指针与指针常量 关于按位运算符(&.|.<<.>>)   关于常量指针和指针常量 两个概念经常混淆啊,这是在考中文四六级啊,所以我给这两个概念起个长一点的名字. ...

  6. html5 Application Cache——加快简历二次访问速度

    上篇博客(在github上写个人简历——最简单却又不容易的内容罗列)介绍了我在github上放的一个个人在线简历,有朋友看了后告诉我一个很大缺陷,使用github挺慢的,每次看的时候都很慢,第一反应这 ...

  7. Java基础之常用类

    1.Collections类: (1)此类完全由在 collection 上进行操作或返回 collection 的静态方法组成. (2)静态方法摘要: static <T> boolea ...

  8. JS之BOM

    ECMAScript 是 JavaScript 的核心,但如果要在 Web 中使用 JavaScript,那么 BOM(浏览器对象模型)则无疑才是真正的核心.BOM 提供了很多对象,用于访问浏览器的功 ...

  9. Atitit. Atiposter 发帖机 新特性 poster new feature v11  .docx

    Atitit. Atiposter 发帖机 新特性 poster new feature v11  .docx 1.1.  版本历史1 2. 1. 未来版本规划2 2.1. V12版本规划2 2.2. ...

  10. Atitit usrQBM2331 参数格式化规范

    Atitit usrQBM2331 参数格式化规范 String sql = "insert agent(uid,parent_id,pwd,name,tel,wechat,bkkad,si ...