爬取JSON文件并且存储

思路

　　1 先调用模块

　　2 定义一个函数

　　　　2.1 获取网址（点击评论找到JSON的文件（分析评论preview）获取Request URL后面的地址）

　　　　2.2 添加用户的请求头

　　　　2.3 使用get方法发送请求

　　　　2.4 转化格式并返回（return）格式（.text）

　　3. 应为要以键值对的格式保存所以定义一个函数删除并且返回删除（replace）

　　4. 类型转换并且返回

　　　　4.1 return json.loads(传入参数的名称)

　　5. 保存获取到的JSON数据

　　　　5.1 open 一定要注意格式utf-8

　　6. 传入参数的函数

　　　　6.1 data = 2

　　　　6.2 s = 3(data)

　　　　6.3 5(s)

　　7. 运行调用

　　　　7.1 if __name__ ==‘__main__’:

　　　　　　　　6()

例题代码

import requests

import json

def name_1():

    # 获取网址 点击评论 找到有JSON的文件（分析评论 preview）获取Request URL后面的地址

    url = 'https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=100007080973&score=0&sortType=5&page=0&pageSize=10&isShadowSku=0&fold=1'

    # 添加用户请求头

    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36'}

    # 使用get方法发送请求

    resp = requests.get(url,headers=headers)

    # 转换格式 并返回（return）

    return resp.text

def name_2(data_1):

    # 因为是键值对的形式 所以要删除一些东西 并且返回

    return data_1.replace('fetchJSON_comment98(','').replace(');','') #如果为str类型

def name_3(data_2):

    # 类型转换 并且返回

    return json.loads(data_2)

def name_4(obj):

    # 保存获取到的JSON数据

    json.dump(obj,open('京东销量最好的固态数据.txt','w',encoding='utf-8'),ensure_ascii=False)

def name():

    data = name_1()

    s = name_2(data)

    print(type(name_3(s)))

    print(s)

    name_4(s)

if __name__ == '__main__':

    name()

爬取JSON文件并且存储的更多相关文章

豆瓣电影信息爬取(json)
豆瓣电影信息爬取(json) # a = "hello world" # 字符串数据类型# b = {"name":"python"} # ...
正则爬取豆瓣Top250数据存储到CSV文件（6行代码）
利用正则爬取豆瓣TOP250电影信息电影名字电影年份电影评分评论人数 import requests import csv import re # 不算导包的话正式代码6行存储到csv文件 ...
使用HtmlAgilityPack爬取网站信息并存储到mysql
前言:打算做一个药材价格查询的功能,但刚开始一点数据都没有靠自己找信息录入的话很麻烦的,所以只有先到其它网站抓取存到数据库再开始做这个了. HtmlAgilityPack在c#里应该很多人用吧,简单又 ...
python之爬虫（爬取.ts文件并将其合并为.MP4文件——以及一些异常的注意事项）
//20200115 最近在看“咱们裸熊——we bears”第一季和第三季都看完了,单单就第二季死活找不到,只有腾讯有资源,但是要vip……而且还是国语版……所以就瞄上了一个视频网站——可以在线观看 ...
python爬虫26 | 把数据爬取下来之后就存储到你的MySQL数据库。
小帅b说过在这几篇中会着重说说将爬取下来的数据进行存储上次我们说了一种 csv 的存储方式这次主要来说说怎么将爬取下来的数据保存到 MySQL 数据库接下来就是学习python的正确姿势真 ...
scrapy --爬取媒体文件示例详解
scrapy 图片数据的爬取基于scrapy进行图片数据的爬取: 在爬虫文件中只需要解析提取出图片地址,然后将地址提交给管道配置文件中写入文件存储位置:IMAGES_STORE = './imgs ...
scrapy架构与目录介绍、scrapy解析数据、配置相关、全站爬取cnblogs数据、存储数据、爬虫中间件、加代理、加header、集成selenium
今日内容概要 scrapy架构和目录介绍 scrapy解析数据 setting中相关配置全站爬取cnblgos文章存储数据爬虫中间件和下载中间件加代理,加header,集成selenium 内 ...
基于nodejs模拟浏览器post请求爬取json数据
今天想爬取某网站的后台传来的数据,中间遇到了很多阻碍,花了2个小时才请求到数据,所以我在此总结了一些经验. 首先,放上我所爬取的请求地址http://api.chuchujie.com/api/?v= ...
爬取json Swaggerui界面
对一个静态的网页进行爬取. 要获取的内容分别为 paths 标签下的 1./quota/开头的路径 2. get 这样的httpmode 3 description对应的描述 4 summary 5 ...
scrapy爬取数据进行数据库存储和本地存储
今天记录下scrapy将数据存储到本地和数据库中,不是不会写,因为小编每次都写觉得都一样,所以记录下,以后直接用就可以了-^o^- 1．本地存储设置pipel ines.py class Ak17P ...

随机推荐

JDK的安装及卸载
JDK安装及卸载卸载JDK 删除JAVA安装目录删除java_home 删除path下关于Java的目录 java-version 查看是否仍能查看安装JDK 百度搜索JDK8(性能稳定)找到下 ...
Jmeter添加BeanShell后置处理程序保存响应结果
对于某些请求,无法通过保存响应到文件这个组件来进行保存(会出现UNKNOW文件类型). 那么就可以通过BeanShell后置处理程序来进行将响应结果直接输出到文件,并可以直接指定文件名和后缀. imp ...
luogu 4886
点分治好题统计距离正常点分治统计即可,我们只需考虑何时达到最优有两种情况: 第一:代价最大的询问两个端点在不同的两个子树中因为这种情况下,无论根向那个子树移动都会等价地增加到达另一个端点的代价, ...
SOC平台，网络安全管理平台
SOC平台,网络安全管理平台提供集中.统一.可视化的安全信息管理,通过实时采集各种安全信息,动态进行安全信息关联分析与风险评估,实现安全事件的快速跟踪.定位和应急响应. 从监控.审计.风险和运维四个 ...
Java中的super和this关键字——
super与this关键字先总结再解释: super关键字:我们可以通过super关键字来实现对父类成员的访问,用来引用当前对象的父类. this关键字:指向自己的引用. super注意点: 1.s ...
SQL servr——基础篇之DML增删改查
DML:数据操作语言用于添加.更新.删除和查询数据库中的语言添加--insert语句向数据表中插入新的行(记录)可多行可一行语法:insert [into] 表名 [(column1,. ...
Python爬虫之Scrapy框架爬虫实战
Python爬虫中Scrapy框架应用非常广泛,经常被人用于属于挖掘.检测以及自动化测试类项目,为啥说Scrapy框架作为半成品我们又该如何利用好呢 ?下面的实战案例值得大家看看. 目录: 1.Scr ...
04 Hadoop思想与原理
Hadoop最早起源于Nutch.Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取.索引.查询等功能,但随着抓取网页数量的增加,遇到了严重的可扩展性问题--如何解决数十亿网页的存储和索引 ...
jetson TX2 + opencv3.4 + python3 + 双目 +人脸检测
淘宝看到一款很便宜的双目,150元,就买了.想着用它学习一下opencv,好换个工作.当然,也想着能否用它做一些好玩的,比如三维重建之类高大上的东西.先用便宜的入个门,等以后眼界高了再看是不是买那些更 ...
Spring 笔记一
1.什么是框架? 框架,是一种半成品的软件,是高度抽取可重用代码的一种设计,多个可重用模块的集合,形成某个领域的整体解决方案. 2.Spring 框架概述:Spring 是一个开源框架,一个容器框架 ...

爬取JSON文件并且存储

爬取JSON文件并且存储的更多相关文章

随机推荐

热门专题