python3抓取中国天气网不同城市7天、15天实时数据

思路：
1、根据city.txt文档来获取不同城市code
2、获取中国天气网7d和15d不同城市url
3、利用requests库请求url获取html内容
4、利用beautifulsoup获取7d和15d指定天气数据
5、将获取的天气数据保存到csv文件中

# -*- coding: utf-8 -*-

import requests

from bs4 import BeautifulSoup

import csv

'''

获取不同城市code

'''

def get_citycode(city_name):

    with open('city.txt', 'r', encoding='UTF-8') as fs:

        lines = fs.readlines()#一次读取整个文件内容，且自动分成一行列表，readline(）每次只读取一行

        for line in lines:

            if(city_name in line):

                code = line.split('=')[0].strip()#每行去掉头尾空格，且用“=”分隔出code和cityname，返回字符串列表

                return code

    raise ValueError('invalid city name')#抛出异常

'''

获取不同城市7天url

'''

def get_7d_url(city_name):

    url = 'http://www.weather.com.cn/weather/'

    code = get_citycode(city_name)

    return url + code + '.shtml'

'''

获取不同城市15天url

'''

def get_15d_url(city_name):

    url = 'http://www.weather.com.cn/weather15d/'

    code = get_citycode(city_name)

    return url + code + '.shtml'

''''

获取html内容

'''

def get_content(url, data=None):

    rep = requests.get(url, timeout=60)

    rep.encoding = 'utf-8'

    return rep.text

'''

获取7天指定数据

'''

def get_7d_data(htmltext, city):

    content = []

    bs = BeautifulSoup(htmltext, "html.parser")

    body = bs.body

    data = body.find('div', {'id': '7d'})

    ul = data.find('ul')

    li = ul.find_all('li')

    for day in li:

        line = [city]

        date = day.find('h1').string

        p = day.find_all('p')

        text = p[0].string

        if p[1].find('span') is None:

            temperature_H = None

        else:

            temperature_H = p[1].find('span').string

        temperature_L = p[1].find('i').string

        wind_force = p[2].find('i').string

        line.append(date)

        line.append(text)

        line.append(temperature_H)

        line.append(temperature_L)

        line.append(wind_force)

        content.append(line)

    return content

'''

获取15天指定数据

'''

def get_15d_data(htmltext, city):

    content = []

    bs = BeautifulSoup(htmltext, "html.parser")

    body = bs.body

    data = body.find('div', {'id': '15d'})

    ul = data.find('ul')

    li = ul.find_all('li')

    for day in li:

        line = [city]

        span = day.find_all('span')

        date = span[0].string

        text = span[1].string

        if span[2].find('em') is None:

            temperature_H = None

        else:

            temperature_H = span[2].find('em').string

        temperature_L = span[2].string

        wind_direction = span[3].string

        wind_force = span[4].string

        line.append(date)

        line.append(text)

        line.append(temperature_H)

        line.append(temperature_L)

        line.append(wind_direction)

        line.append(wind_force)

        content.append(line)

    return content

'''

保存获取到的天气数据

csv文件

'''

def save_data(data, filename):

    with open(filename, 'a', errors='ignore', newline='') as f: #newline=" "是为了避免写入之后有空行

        f_csv = csv.writer(f)

        f_csv.writerows(data)#数据整行写入csv文件中

'''

爬取7天天气数据

'''

def _7d(city):

    url = get_7d_url(city)

    html = get_content(url)

    result = get_7d_data(html,city)

    save_data(result, 'E:\weather.csv')

'''

爬取15天天气数据

'''

def _15d(city):

    url = get_15d_url(city)

    html = get_content(url)

    result = get_15d_data(html,city)

    save_data(result, 'E:\weather.csv')

if __name__ == '__main__':

    cities = input('city name: ').split(' ')  # 键盘输入城市，用空格分隔开

    for city in cities:

        _7d(city)

        _15d(city)

附：city.txt 获取地址：https://pan.baidu.com/s/1VNW8AJi6_zo7mP_90lTkiA 提取码：red5

python3抓取中国天气网不同城市7天、15天实时数据的更多相关文章

Python爬取中国天气网
Python爬取中国天气网基于requests库制作的爬虫. 使用方法:打开终端输入 “python3 weather.py 北京(或你所在的城市)" 程序正常运行需要在同文件夹下加入一个 ...
初识python 之爬虫：爬取中国天气网数据
用到模块: 获取网页并解析:import requests,html5lib from bs4 import BeautifulSoup 使用pyecharts的Bar可视化工具"绘制图表& ...
scrapy实例:爬取中国天气网
1.创建项目在你存放项目的目录下,按shift+鼠标右键打开命令行,输入命令创建项目: PS F:\ScrapyProject> scrapy startproject weather # w ...
吴裕雄--天生自然python爬虫：使用requests模块的get和post方式抓取中国旅游网站和有道翻译网站翻译内容数据
import requests url = 'http://www.cntour.cn/' strhtml = requests.get(url) print(strhtml.text) URL='h ...
中国天气网API接口
http://www.weather.com.cn/data/sk/101010100.html http://www.weather.com.cn/data/cityinfo/101010100.h ...
中国天气网-天气预报接口api
中国天气网地址:http://www.weather.com.cn 请求服务 : 查询实时天气信息 http://www.weather.com.cn/data/sk/101110101.html 在 ...
爬虫-通过本地IP地址从中国天气网爬取当前城市天气情况
1.问题描述最近在做一个pyqt登录校园网的小项目,想在窗口的状态栏加上当天的天气情况,用爬虫可以很好的解决我的问题. 2.解决思路考虑到所处位置的不同,需要先获取本地城市地址,然后作为中 ...
中国天气网 JSON接口的城市编码解析及结果
最近在弄一个Android应用,其中一个功能是天气情况展示,准备使用google的天气API服务(http://www.google.com/ig/api?hl=zh-cn&weather=, ...
第十二、模块二、调用中国天气网和qqOnline及TrainTimeWebService接口来突出Json方法
一. 浏览网页的时候,发送的请求.服务器反回来的永远是字符串,由于服务器后台使用的语言不通,所以就需要用工具反解,这里用到了json json方法一 json.loads()将字符串转化为python ...

随机推荐

max函数结合lambda使用
说明:d.keys() 以及列表可以看做lambda函数的实参,max的判断对象是key的值.最终返回的是使得key的值最大的那个实参.
selenium实现chrome分屏截图的合并
selenium的截图功能在chrome下无法实现,但是可以操作滚动条来一屏一屏的截图,然后再合并成一张图,合并图片的代码在网上找的,十分感谢那位朋友,具体解决方案如下:直接上代码: def capt ...
vue-cli中route和router的区别
在使用vue-router的时候经常分不清router和route的区别: 在函数式编程中: this.$router.push('/login') 或者Router.push() 在动态获取路由参数 ...
phpfor函数和foreach函数
PHP for 循环 PHP While 循环 PHP 函数 PHP for 循环执行代码块指定的次数. PHP for 循环如果您已经提前确定脚本运行的次数,可以使用 for 循环. 语法 for ...
Oracle中关键字like的使用总结
Like 模糊查询占位符 % 任意个数字符 _ 一个字符查询用户名以‘S’开头的员工信息 Select * from emp where ename like 'S%' 查询用户名第二个字母 ...
linux各种中文乱码解决办法整理
2016年03月21日 15:52:05 阅读数:30812 远程登录服务器用vim在终端下编辑查看文件经常会遇见各种中文乱码问题.做如下设置可基本解决vim中文乱码问题首先查看系统对中文的支持lo ...
全面解读php-开发环境及配置
一.版本控制软件 1.集中式 (CVS和 SVN) 中间有一个中央服务器,所有的客户机都会把版本信息上传到中央服务器里,版本信息只在中央服务器里保存,当我们去上传或者下载的时候 ,都是从中央服务器来连 ...
读取位置 0xcccccccc 时发生访问冲突
XXXXX.exe 中的 0x1004eec2 处有未经处理的异常: 0xC0000005: 读取位置 0xcccccccc 时发生访问冲突 DEBUG模式下总是出现此错误,改为Release模式,错 ...
安装源配置文件“/etc/apt/sources.list”问题
安装docker过程中使用以下命令设置稳定存储库. $ sudo add-apt-repository \ "deb [arch=amd64] https://download.docker ...
Win10卸载预装应用
Win10的预装应用大多数都比较鸡肋,没啥用,喜欢纯净的系统的朋友可以将其卸载掉. 1.以管理员身份启动powershell,键入命令[Get-AppxPackage | Select Name, P ...

python3抓取中国天气网不同城市7天、15天实时数据

python3抓取中国天气网不同城市7天、15天实时数据的更多相关文章

随机推荐

热门专题