python 爬虫系列07-天气爬虫

看天气

import requests

from bs4 import BeautifulSoup

ALL_DATA = []

def parse_page(url):

    headers = {

        'User-Agent': "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.84 Safari/537.36"

    }

    response = requests.get(url, headers=headers)

    text = response.content.decode('utf-8')

    soup = BeautifulSoup(text, 'html5lib')

    conMidtab = soup.find('div', class_='conMidtab')

    tables = conMidtab.find_all('table')

    for table in tables:

        trs = table.find_all('tr')[2:]

        for index,tr in enumerate(trs):

            tds = tr.find_all('td')

            city_td = tds[0]

            if index == 0:

                city_td = tds[1]

            city = list(city_td.stripped_strings)[0]

            temp_td = tds[-2]

            min_temp = list(temp_td.stripped_strings)[0]

            ALL_DATA.append({"城市 ":city,"温度 ":int(min_temp)})

          #  print("城市: %s ,温度%s℃ " % (city,int(min_temp)))

def main():

    urls = {

        'http://www.weather.com.cn/textFC/hb.shtml',

        'http://www.weather.com.cn/textFC/db.shtml',

        'http://www.weather.com.cn/textFC/hd.shtml',

        'http://www.weather.com.cn/textFC/hz.shtml',

        'http://www.weather.com.cn/textFC/hn.shtml',

        'http://www.weather.com.cn/textFC/xb.shtml',

        'http://www.weather.com.cn/textFC/xn.shtml',

        'http://www.weather.com.cn/textFC/gat.shtml'

    }

    for url in urls:

        parse_page(url)

    ALL_DATA.sort(key=lambda data:data['min_temp'])

    print(ALL_DATA)

if __name__ == "__main__":

    main()

python 爬虫系列07-天气爬虫的更多相关文章

java爬虫系列第一讲-爬虫入门
1. 概述 java爬虫系列包含哪些内容? java爬虫框架webmgic入门使用webmgic爬取 http://ady01.com 中的电影资源(动作电影列表页.电影下载地址等信息) 使用web ...
python爬虫系列之初识爬虫
前言我们这里主要是利用requests模块和bs4模块进行简单的爬虫的讲解,让大家可以对爬虫有了初步的认识,我们通过爬几个简单网站,让大家循序渐进的掌握爬虫的基础知识,做网络爬虫还是需要基本的前端的 ...
python 爬虫系列03--职位爬虫
职位爬虫 import requests from lxml import etree cookie = { 'Cookie':'user_trace_token=20181015184304-692 ...
爬虫系列(八) 用requests实现天气查询
这篇文章我们将使用 requests 调用天气查询接口,实现一个天气查询的小模块,下面先贴上最终的效果图 1.接口分析虽然现在网络上有很多免费的天气查询接口,但是有很多网站都是需要注册登陆的,过程比 ...
Python3爬虫系列：理论+实验+爬取妹子图实战
Github: https://github.com/wangy8961/python3-concurrency-pics-02 ,欢迎star 爬虫系列: (1) 理论 Python3爬虫系列01 ...
爬虫系列(三) urllib的基本使用
一.urllib 简介 urllib 是 Python3 中自带的 HTTP 请求库,无需复杂的安装过程即可正常使用,十分适合爬虫入门 urllib 中包含四个模块,分别是 request:请求处理模 ...
爬虫系列(九) xpath的基本使用
一.xpath 简介究竟什么是 xpath 呢?简单来说,xpath 就是一种在 XML 文档中查找信息的语言而 XML 文档就是由一系列节点构成的树,例如,下面是一份简单的 XML 文档: &l ...
爬虫系列(五) re的基本使用
1.简介究竟什么是正则表达式 (Regular Expression) 呢?可以用下面的一句话简单概括: 正则表达式是一组特殊的字符序列,由一些事先定义好的字符以及这些字符的组合形成,常常用于匹 ...
爬虫系列(七) requests的基本使用
一.requests 简介 requests 是一个功能强大.简单易用的 HTTP 请求库,可以使用 pip install requests 命令进行安装下面我们将会介绍 requests 中常用 ...

随机推荐

（转）【推荐】使用Jquery+EasyUI进行框架项目开发案例讲解之一---员工管理源码分享
原文地址:http://www.cnblogs.com/huyong/p/3334848.html 在开始讲解之前,我们先来看一下什么是Jquery EasyUI?jQuery EasyUI是一组基于 ...
跨域Ajax请求（jQuery JSONP MVC）
通过jQuery的$.ajax方法发送JSONP请求 js代码 <script type="text/javascript"> function jsonptest2( ...
duilib入门简明教程 -- 第一个程序 Hello World(3)
小伙伴们有点迫不及待了么,来看一看Hello World吧: 新建一个空的win32项目,新建一个main.cpp文件,将以下代码复制进去: #include <windows.h> #i ...
spring深入了解心得
spring 主要核心组件 :Core.上下文(Context) .实体(Bean): spring 主要由两大特色:控制反转(IOC).面向对象(AOP): spring中Core主要用于组建Bea ...
.Net Core .Net Core V1.0 创建MVC项目
.Net Core V1.0 创建MVC项目创建MVC项目有两种方式: 一.创建Web项目:(有太多没用的东西要去删太麻烦) 2.项目目录结构: 此种方法要注意的是,会创建好多个json文件,下面就 ...
day08.1-Linux软件包管理
Linux系统中的两种软件包:tar,保存内容为源码,编译后再安装:rpm,保存内容为编译后的机器码,直接安装.其中,rpm软件包由5部分构成,分别为: 第1部分是name,表示这个rpm软件包的名称 ...
【bzoj4869】[Shoi2017]相逢是问候线段树+扩展欧拉定理
Description Informatikverbindetdichundmich. 信息将你我连结.B君希望以维护一个长度为n的数组,这个数组的下标为从1到n的正整数.一共有m个操作,可以分为两 ...
Java面向对象之内部类（匿名内部类）
一.基础概念匿名内部类:简化书写的内部类.其实匿名内部类就是一个子类对象. 前提:内部类需要继承或者实现外部的类或者接口. 格式:new 父类或者接口(){定义子类的内容} 二.将内部类定义到局部的 ...
Error creating bean with name 'dateSource' defined in file 错误信息
问题的原因: 在web项目中搭建SSM框架,启动Tomcat时出现错误信息有配置文件:applicationContext-mybatis.xml (Spring配置) spring-servlet ...
对于自我管理 ObjectContextManager的测试
书接上文, 把代码改为多线程, public class Threads { public static void allStart() { for (int i = 0; i < 10; ...

python 爬虫系列07-天气爬虫

python 爬虫系列07-天气爬虫的更多相关文章

随机推荐

热门专题