Python：爬取中国各市的疫情数据并存储到数据库

import requests

import pymysql

import json

def create():

    # 连接数据库

    db = pymysql.connect(host = 'localhost', user = 'root', password ='258000', database = 'yiqing',charset='utf8')

    # 使用 cursor() 方法创建一个游标对象 cursor

    cursor = db.cursor()

    # 使用 execute() 方法执行 SQL，如果表存在则删除

    cursor.execute("DROP TABLE IF EXISTS payiqing")

    # 使用预处理语句创建表

    sql = """CREATE TABLE payiqing (

            Id INT PRIMARY KEY AUTO_INCREMENT,

            UpDateTime varCHAR(255),

            Province varchar(255),

            City varchar(255),

            Confirm varchar(255),

            Confirm_add varchar(255),

            Heal varchar(255),

            Dead varchar(255))"""

    #upDateTime,provinse,city,confirm,confirm_add,heal,dead

    cursor.execute(sql)

    #关闭数据库连接

    db.close()

def insert(value):

    # 连接数据库

    db = pymysql.connect(host = 'localhost', user = 'root', password ='258000', database = 'yiqing',charset='utf8')

    # 使用 execute() 方法执行 SQL，如果表存在则删除

    cursor = db.cursor()

    # 使用预处理语句插入数据

    sql = "INSERT INTO payiqing(UpDateTime,Province,City,Confirm,Confirm_add,Heal,Dead) VALUES ( %s,%s,%s,%s,%s,%s,%s)"

    #updateDateTime,provinse,city,confirm,confirm_add,heal,dead

    try:

        cursor.execute(sql, value)

        db.commit()

        print('插入数据成功')

    except:

        db.rollback()

        print("插入数据失败")

    db.close()

create()  # 创建表

#目标网站

url = 'http://view.inews.qq.com/g2/getOnsInfo?name=disease_h5'

#请求资源，获取相应内容

resp = requests.post(url)

#打印网页内容 print(resp.text)

# 将响应信息进行json格式化

#一个从文件加载，一个从内存加载#json.load(filename)#json.loads(string)

jsonData = json.loads(resp.text)

data_all = json.loads(jsonData["data"])

#保存全国历史数据

history = {}

#print(data_all.keys())

i = data_all["chinaTotal"]

history = {"lastUpdateTime":data_all["lastUpdateTime"],"confirm":i["confirm"] ,"heal":i["heal"],"dead":i["dead"],"suspect":i["suspect"]}

#print(history)

#用于存储当日详细数据的集合

details = []

upDateTime = data_all["lastUpdateTime"]#储存最近更新时间

data_province = data_all["areaTree"][0]["children"] #中国各省

#遍历存储

for pro in data_province:

  provinse = pro["name"]   #省名

  for cit in pro["children"]:

    city = cit["name"]

    confirm = cit["total"]["confirm"]

    confirm_add = cit["today"]["confirm"]

    heal = cit["total"]["heal"]

    dead = cit["total"]["dead"]

    insert((upDateTime,provinse,city,confirm,confirm_add,heal,dead))#存入数据库

Python：爬取中国各市的疫情数据并存储到数据库的更多相关文章

Python爬取中国天气网
Python爬取中国天气网基于requests库制作的爬虫. 使用方法:打开终端输入 “python3 weather.py 北京(或你所在的城市)" 程序正常运行需要在同文件夹下加入一个 ...
python 爬取天猫美的评论数据
笔者最近迷上了数据挖掘和机器学习,要做数据分析首先得有数据才行.对于我等平民来说,最廉价的获取数据的方法,应该是用爬虫在网络上爬取数据了.本文记录一下笔者爬取天猫某商品的全过程,淘宝上面的店铺也是类似 ...
python爬取中国天气网站数据并对其进行数据可视化
网址:http://www.weather.com.cn/textFC/hb.shtml 解析:BeautifulSoup4 爬取所有城市的最低天气对爬取的数据进行可视化处理按温度对城市进行排 ...
Python爬取6271家死亡公司数据，一眼看尽十年创业公司消亡史！
小五利用python将其中的死亡公司数据爬取下来,借此来观察最近十年创业公司消亡史. 获取数据 F12,Network查看异步请求XHR,翻页. 成功找到返回json格式数据的url, 很多人 ...
Python 爬取大众点评 50 页数据，最好吃的成都火锅竟是它！
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 胡萝卜酱 PS:如有需要Python学习资料的小伙伴可以加点击下方链 ...
Python爬取上交所一年大盘数据
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 半个码农2018 PS:如有需要Python学习资料的小伙伴可以加点 ...
Python爬取6271家死亡公司数据，看十年创业公司消亡史
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 朱小五凹凸玩数据 PS:如有需要Python学习资料的小伙伴可以加 ...
python爬取中国大学排名
教程来自:[Python网络爬虫与信息提取].MOOC. 北京理工大学目标:爬取最好大学网前50名大学代码如下: import requests from bs4 import Beautiful ...
Python爬取某网站文档数据完整教程（附源码）
基本开发环境 (https://jq.qq.com/?_wv=1027&k=NofUEYzs) Python 3.6 Pycharm 相关模块的使用 (https://jq.qq.com/?_ ...

随机推荐

Springboot循环依赖实践纪实
测试的Springboot版本: 2.6.4,禁止了循环依赖,但是可以通过application.yml开启(哈哈) @Lazy注解解决循环依赖情况一:只有简单属性关系的循环依赖涉及的Bean: ...
selenium+python安装
整理了下selenium+python环境搭建,搭建了很多次但每次都还是手忙脚乱,今天用心整理下 selenium 是用于测试 Web 应用程序用户界面 (UI) 的常用框架,并且 Selenium ...
egg中使用sequelize事务，实现原子性
let transaction; try { // 建立事务对象 transaction = await this.ctx.model.transaction(); const house = awa ...
Asp.net Core Filter过滤器异常处理
本文旨在: 1 继承ExceptionFilterAttribute,重写Override OnException(ExceptionContext context)处理异常 2 在.netCore中 ...
Java中对文件的处理01-递归删除
package com.ricoh.rapp.ezcx.admintoolweb.util; import java.io.BufferedInputStream; import java.io.Bu ...
python 命令行参数学习（二）
照着例子看看打打,码了就会.写了个命令行参数调用进行运算的脚本. 参考文章链接:http://www.jianshu.com/p/a50aead61319 #-*-coding:utf-8-*- __ ...
ES6中数组新增的方法-超级好用
Array.find((item,indexArr,arr)=>{}) 掌握找出第一个符合条件的数组成员. 它的参数是一个回调函数,对所有数组成员依次执行该回调函数. 直到找出第一个返回值为t ...
redux和vuex以及dva?
redux: 通过store存储,通过action唯一更改,reducer描述如何更改.dispatch一个action dva: 基于redux,结合redux-saga等中间件进行封装 vuex: ...
Redis的安装与启动(一)
Redis是c语言开发的. 安装redis需要c语言的编译环境.如果没有gcc需要在线安装.yum install gcc-c++ 安装步骤: 第一步:redis的源码包上传到linux系统.--源码 ...
CI_CD 简单了解

Python：爬取中国各市的疫情数据并存储到数据库

Python：爬取中国各市的疫情数据并存储到数据库的更多相关文章

随机推荐

热门专题