http://www.pm25.com/shenzhen.html抓取北京,深圳,上海,广州,成都的pm2.5指数,并按照空气质量从优到差排序,保存在txt文档里

代码如下:

 #coding=utf-8
 from selenium import webdriver
 from time import sleep

 class PM:

     def __init__(self):
         self.dr = webdriver.Chrome()
         self.pm25_info = self.get_pm25_info()

     def get_pm25_info(self):
         city_list = ['beijing','shenzhen','shanghai','guangzhou','chengdu']
         pm_info_list = []
         i = 0
         while i < len(city_list):
             self.dr.get('http://www.pm25.com/'+city_list[i]+'.html')
             sleep(3)
             city_name = self.dr.find_element_by_css_selector('.bi_loaction_city').text #定位城市名字
             pm_exp = self.dr.find_element_by_css_selector('.pm25_span').text #定位PM2.5指数
             air_num = self.dr.find_element_by_css_selector('.bi_aqiarea_num').text #定位AQI指数
             air_quality = self.dr.find_element_by_css_selector('.bi_aqiarea_right span').text #定位空气质量描述
             pm_info_list.append((city_name, pm_exp, air_num, air_quality))
             i += 1
         pm_info_list.sort(key=lambda x:float(x[2])) #按AQI指数排序(AQI指数决定了空气质量的优良)
         return pm_info_list

     def get_pm_info_file(self):
         self.file_title = '北上广深成五地PM2.5数据信息'
         self.file = open(self.file_title + '.txt', 'wb')
         self.floor = 1
         for item in self.pm25_info:
             separate_line = '**********' + 'TOP' + str(self.floor) + '**********\n'
             self.file.write(separate_line.encode('utf-8'))
             self.file.write(('城市:' + item[0] + '\n'
                              'PM2.5指数:' + item[1] + ' '+ '微克/立方米' + '\n'
                              'AQI指数:' + item[2] + '\n'
                              '空气质量:' + item[3]+ '\n').encode('utf-8'))
             self.floor += 1
         self.file.close()

     def quit(self):
         self.dr.quit()

 if __name__ == '__main__':
     pm_info = PM()
     pm_info.get_pm_info_file()
     pm_info.quit()

网页如下:

生成txt如下:

用python+selenium获取北上广深成五地PM2.5数据信息并按空气质量排序的更多相关文章

  1. 我用 Python 爬了智联“北上广深”5400条 Java 招聘数据

    结论 国际惯例,先上结论. Java 类职位招聘,不论是需求量(工作机会),还是工资平均水平,都是帝都北京最好. 北京和上海的平均工资差距不大(不超过200/月),但上海的需求量是北京的一半,机会更少 ...

  2. 为什么现在很多年轻人愿意来北上广深打拼,即使过得异常艰苦,远离亲人,仍然义无反顾? 谈谈程序员返回家乡的创业问题 利基市场就是那些不大不小的缝隙中的市场 马斯洛的需求无层次不适合中国。国人的需求分三个层次——生存、稳定、装逼。对应的,国内的产品也分三个层次——便宜、好用、装B。人们愿意为这些掏钱

    信念.思考.行动-谈谈程序员返回家乡的创业问题 昨天晚上在微博上看了篇 <为什么现在很多年轻人愿意来北上广深打拼,即使过得异常艰苦,远离亲人,仍然义无反顾?>,有些话想说. 感觉很多人的担 ...

  3. 【转帖】5G基站建设下的“中国速度”:北上广深领跑全国,均超1万个

    5G基站建设下的“中国速度”:北上广深领跑全国,均超1万个 https://www.laoyaoba.com/html/news/newsdetail?source=pc&news_id=73 ...

  4. python获取全国各个城市pm2.5、臭氧等空气质量

    随着国家发展,中国很多城市的空气质量其实并不好,国家气象局会有实时统计,但是要去写爬虫爬取是十分麻烦的事情,并且官方网站也会做一些反爬虫措施,所以实现起来比较麻烦,最好的办法就是使用现成的免费接口,空 ...

  5. 在CentOS下利用Python+selenium获取腾讯首页的今日话题。

    1.安装依赖包 yum install wget firefox gcc zlib zlib-devel Xvfb 2.安装setuptools 官网地址:https://pypi.python.or ...

  6. 用python+selenium获取XX省交通违章数据

    前言: 目前在研究易信公众号,想给公众号增加一个获取个人交通违章的查询菜单,通过点击返回查询数据.以下是实施过程. 一.首先,用火狐浏览器打开XX省交管网,分析页面信息: 可以看到共有4种查询种类,我 ...

  7. python selenium 获取对象输入的属性值

    .get_attribute("value") from selenium import webdriver import time driver=webdriver.Firefo ...

  8. 【Azure 环境】【Azure Developer】使用Python代码获取Azure 中的资源的Metrics定义及数据

    问题描述 使用Python SDK来获取Azure上的各种资源的Metrics的名称以及Metrics Data的示例 问题解答 通过 azure-monitor-query ,可以创建一个 metr ...

  9. 北上广等一线城市IT岗位已接近饱和?

    IT行业的技术者,时常被我们戏称为「IT民工」,虽然行业内巨大的人才需求和相对容易得到的高薪在源源不断的吸引各路人马加入,但它依旧在全球最缺人的十大行业中位居榜首. 我身边的朋友大都问过我这样一个疑问 ...

随机推荐

  1. Eclipse快捷键汇总

    [ALT+/] 此快捷键为用户编辑的好帮手,能为用户提供内容的辅助,不要为记不全方法和属性名称犯愁,当记不全类.方法和属性的名字时,多体验一下[ALT+/]快捷键带来的好处吧. 2 [Ctrl+O] ...

  2. gtp转换mbr

    http://wenku.baidu.com/link?url=P_t0U8Q-LIUdxVGHBefipAvbV6fg3jnX8hc8ugaRoo5WWd8GJePO8sBbtLON15gvOZh4 ...

  3. js动画之平抛运动

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  4. 用Mockito mock普通的方法

    上面的例子是很理想化的状态,但是在实际的开发中,我们需要经常调用一些依赖特定环境的函数或者调用同事写的代码,而同事仅提供了接口.这个时候就需要利用Mockito来协助我们完成测试. 当然,你可以选择e ...

  5. Iframe 知识点总结

    JS刷新框架外页面七种实现代码: 1. window.parent.frames[1].location.reload(); 2. window.parent.frames.bottom.locati ...

  6. ArrayList和Vector的区别

    3.ArrayList和Vector的区别 答: 这两个类都实现了List接口(List接口继承了Collection接口),他们都是有序集合,即存储在这两个集合中的元素的位置都是有顺序的,相当于一种 ...

  7. CheckBoxList控件获取多选择,需要遍历

    CheckBoxList控件获取多选择,需要遍历,环境:vs2008 在页面上添加CheckBoxList控件,输入项值 a,b,c,d.然后添加按钮 Button2确定,如何获取CheckBoxLi ...

  8. sqlserver查看所有的外键约束

    select a.name as 约束名, object_name(b.parent_object_id) as 外键表, d.name as 外键列, object_name(b.reference ...

  9. Python的平凡之路(15)

    一.CSS补充: 1. 上节课讲述 a.css重用               <style>            如果整个页面的宽度 > 900px时:            { ...

  10. css样式多个类、标签用【逗号 空格 冒号 点】分开的解析

    一:#a,b{…………}  id叫a和一个标签是b的样式(平行关系) 二:#a b{…………}  id叫a下面的一个标签是b的样式(包含关系) 三:#a.b{…………}  id叫a的下面的class叫 ...