使用python爬取天气预报，[python入门案例]

 # 天气网余姚地区爬虫案例

 import requests

 from lxml import etree

 class WeatherSpider:

     def __init__(self):

         self.url = "http://www.weather.com.cn/weather/101210404.shtml"

         self.headers = {

             "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36"}

     def get_url_content(self):

         return requests.get(self.url, headers=self.headers).content.decode()

     def get_weather_data(self, html):

         tmp_html = etree.HTML(html)

         tomorrow_doc = tmp_html.xpath("//div[contains(@class,'con') and contains(@class,'today')]//div[@class='c7d']/ul/li[2]")[0]

         weather_data = {}

         weather_data["date"] = tomorrow_doc.xpath("./h1/text()")[0]

         weather_data["weather"] = tomorrow_doc.xpath("./p[@class='wea']/@title")[0]

         weather_data["temperature_max"] = tomorrow_doc.xpath("./p[@class='tem']/span/text()")[0]

         weather_data["temperature_min"] = tomorrow_doc.xpath("./p[@class='tem']/i/text()")[0]

         weather_data["air_speed"] = tomorrow_doc.xpath("./p[@class='win']/i/text()")[0]

         return weather_data

     def run(self):

         # 获取url请求内容

         content_html = self.get_url_content()

         # 根据url内容获取天气数据

         data = self.get_weather_data(content_html)

         # 打印爬取的天气数据

         print(data)

 if __name__ == '__main__':

     spider = WeatherSpider()

     spider.run()

爬取结果

自己刚学爬虫不久，利用爬虫爬取天气网，每次可以抓取第二天的天气状况，一个小demo

使用python爬取天气预报，[python入门案例]的更多相关文章

Python爬取天气预报
实现爬取一天的天气预报非常简单的一个小爬虫,利用的也是基本的request.BeautifulSoup.re库,算是简单的上手一个小测试吧 from urllib.request import ur ...
python爬取网业信息案例
需求:爬取网站上的公司信息代码如下: import json import os import shutil import requests import re import time reques ...
Python爬取天气预报，Ta的城市开始降温了
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...
python入门学习之Python爬取最新笔趣阁小说
Python爬取新笔趣阁小说,并保存到TXT文件中我写的这篇文章,是利用Python爬取小说编写的程序,这是我学习Python爬虫当中自己独立写的第一个程序,中途也遇到了一些困难,但是最后 ...
【Python爬虫案例】用Python爬取李子柒B站视频数据
一.视频数据结果今天是2021.12.7号,前几天用python爬取了李子柒的油管评论并做了数据分析,可移步至: https://www.cnblogs.com/mashukui/p/1622025 ...
python爬取网站数据保存使用的方法
这篇文章主要介绍了使用Python从网上爬取特定属性数据保存的方法,其中解决了编码问题和如何使用正则匹配数据的方法,详情看下文编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这 ...
利用Python爬取豆瓣电影
目标:使用Python爬取豆瓣电影并保存MongoDB数据库中我们先来看一下通过浏览器的方式来筛选某些特定的电影: 我们把URL来复制出来分析分析: https://movie.douban.com ...
萌新学习Python爬取B站弹幕+R语言分词demo说明
代码地址如下:http://www.demodashi.com/demo/11578.html 一.写在前面之前在简书首页看到了Python爬虫的介绍,于是就想着爬取B站弹幕并绘制词云,因此有了这样 ...
Python 爬取淘宝商品数据挖掘分析实战
Python 爬取淘宝商品数据挖掘分析实战项目内容本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 爬取淘宝商品 ...

随机推荐

Hadoop TextInputFormat
1. TextInputFortmat TextInputFormat是默认的InputFormat.每条记录是一行输入.Key是LongWritable类型,存储该行在整个文件中的字节偏移量(不是行 ...
C语言是菜鸟和大神的分水岭
作为一门古老的编程语言,C语言已经坚挺了好几十年了,初学者从C语言入门,大学将C语言视为基础课程.不管别人如何抨击,如何唱衰,C语言就是屹立不倒:Java.C#.Python.PHP.Perl 等都有 ...
Verilog 编写规范
在学习Python时,作者有一句话对我影响很大.作者希望我们在学习编写程序的时候注意一些业内约定的规范.在内行人眼中,你的编写格式,就已经暴露了你的程度.学习verilog也是一样的道理,一段好的ve ...
codeforces div2 603 E. Editor(线段树)
题目链接:https://codeforces.com/contest/1263/problem/E 题意:一个编译器,每次输入一些字符,R表示光标右移,L表示光标左移,然后有一些左括号( 和右括 ...
主席树 hdu 4348
题意:有一个由n个数组成的序列,有4中操作: 1.C l r d [l,r]这段区间都加上d 2.Q l r 询问[l,r]这段区间的和 3.H l r t 询问之前t时间[l,r]的区间和 4.B ...
SOA架构设计
架构是—套构建系统的准则,通过这套准则,把—个复杂的系统划分为一套更简单的子系统的集合,这些子系统之间保持相互独立,并与整个系统保持一致,而且每—个子系统还可以继续细分下去,从而构成 —个企业级架 ...
.net core IIS 发布
发布时注意事项: 1.本机安装.net core SDK 2.启动项目预加载 3.应用池配置为无托管代码 4.设置应用池-->高级设置-->启动模式为:AlwaysRunning 5.在 ...
RocketMq-粪发涂墙1.0
角色说明 Producer 生产者,用于将消息发送到RocketMQ,生产者本身既可以是生成消息,也可以对外提供接口,由外部来调用接口,再由生产者将受到的消息发送给MQ. Consumer 消费者, ...
oracle中以dba_、user_、v$_、all_、session_、index_开头
原 oracle中以dba_.user_.v$_.all_.session_.index_开头 2011年07月05日 11:26:06 clbxp 阅读数:3279 oracle中以dba_.u ...
8.5-Day1T3--Asm.Def 的一秒
题目大意略... (吐槽这题面...让我毫无阅读兴趣) 题解首先要求出在以两条斜线为新坐标轴下,每个点的坐标那么....按x先排序再求y的最长上升子序列复杂度O(nlogn)吧记得开lon ...

使用python爬取天气预报，[python入门案例]

使用python爬取天气预报，[python入门案例]的更多相关文章

随机推荐

热门专题