JSON

json的引入

在python中json作为一个内建库不需要额外安装，只需要使用import json执行引入

json模块的功能

在python中json模块提供了四个功能：dumps、dump、loads，load

json.loads()

将json格式字符串编码转换为python对象。
json.dumps()

把一个Python对象编码转换成Json字符串，json.dumps() 序列化时默认使用的ascii编码，如果想获取utf-8格式可以使用json.dumps(str, ensure_ascii=False)
json.dump()

将Python内置类型序列化为json对象后写入文件json.dump(list, open("list.json","w"), ensure_ascii=False)
json.load()

读取文件中json形式的字符串元素转化成python类型json.load(open("list.json"))

JsonPath

JsonPath的引入

首先使用pip安装pip install jsonpath，然后引入import jsonpath

JsonPath的使用

表达式	描述
$	根节点
@	现行节点
.or[]	取子节点
..	不管位置，选择所有符合条件的对象
*	匹配所有元素节点
[]	迭代器标示（可以在里边做简单的迭代操作，如数组下标，根据内容选值等）
[,]	支持迭代器中做多选。
?()	支持过滤操作.
()	支持表达式计算

实例

from urllib.request import *

import jsonpath

import json

url = 'http://www.lagou.com/lbs/getAllCitySearchLabels.json'

header = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.80 Safari/537.36"}

request = Request(url, headers=header)

response = urlopen(request)

html = response.read()

obj = json.loads(html)

cityList = jsonpath.jsonpath(obj, '$..name')

print(cityList)

python--爬虫之JSON于JsonPath的更多相关文章

python爬虫requests json与字典对象互相转换
import requests import json ''' json.loads(json_str) json字符串转换成字典 json.dumps(dict) 字典转换成json字符串 ''' ...
Python爬虫开发【第1篇】【Json与JsonPath】
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写.同时也方便了机器进行解析和生成.适用于进行数据交互的场景,比如网站前台与 ...
python爬虫的页面数据解析和提取/xpath/bs4/jsonpath/正则(2)
上半部分内容链接 : https://www.cnblogs.com/lowmanisbusy/p/9069330.html 四.json和jsonpath的使用 JSON(JavaScript Ob ...
python爬虫的页面数据解析和提取/xpath/bs4/jsonpath/正则(1)
一.数据类型及解析方式一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值.内容一般分为两部分,非结构化的数据和结构化的数据. 非结构化数据:先有数据,再有结构, 结构化数 ...
Python爬虫(十六)_JSON模块与JsonPath
本篇将介绍使用,更多内容请参考:Python学习指南数据提取之JSON与JsonPATH JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,它是的人们很容易 ...
python 数据提取之JSON与JsonPATH
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写.同时也方便了机器进行解析和生成.适用于进行数据交互的场景,比如网站前台与 ...
Python爬虫爬取百度翻译之数据提取方法json
工具:Python 3.6.5.PyCharm开发工具.Windows 10 操作系统说明:本例为实现输入中文翻译为英文的小程序,适合Python爬虫的初学者一起学习,感兴趣的可以做英文翻译为中文的 ...
python爬虫12 | 爸爸，他使坏，用动态的 Json 数据，我要怎么搞？
在前面我们玩了好多静态的 HTML 想必你应该知道怎么去爬这些数据了但还有一些常见的动态数据比如商品的评论数据实时的直播弹幕岛国动作片的评分等等这些数据是会经常发生改变的很多网站就会用 ...
爬虫数据提取之JSON与JsonPATH
数据提取之JSON与JsonPATH JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写.同时也方便了机器进行解析和生成.适 ...
【python接口自动化】- 使用json及jsonpath转换和提取数据
前言 JSON(JavaScript Object Notation)是一种轻量级的数据交换格式.它可以让人们很容易的进行阅读和编写,同时也方便了机器进行解析和生成,适用于进行数据交互的场景,比如 ...

随机推荐

Redis07——Redis到底能用在什么地方（下）
在前一篇文章中,我们已经介绍过Redis的一些实际应用.如KV缓存.分布式锁.消息队列,由于篇幅原因,并未介绍完全.接下来将继续为各位带来Redis的更多应用. bitmat(位图) 实现位图的基本 ...
win10安装docker 和 splash
参考链接1:https://www.cnblogs.com/321lxl/p/9536616.html 参考链接2:https://blog.csdn.net/qq_18831501/article/ ...
单元测试 - Tests和UITests (一) 业务测试
单元测试假如我们今天去面试了,面试官问了一句“什么是单元测试?有没有使用?大概是针对那些情况进行单测的?单测意义从你实际使用中总结一下.” 这要在我没进行现在的单测之前这个问题我回答的可能就是“不好 ...
VScode 格式化代码保存时使用ESlint修复代码
前言 eslint vs code 新买的电脑啊啊西装VScode 配置格式化代码保存时使用ESlint修复代码头快炸了,不建议初学者用,太费时间了: 终于搞定---再也不要担心缩进,函数(名)和 ...
扫码枪读取条形码数据（vue）
扫码枪是模拟键盘输入的,所有事件为document.onkeypress = function(){}. 在vue项目中,是没有window.onload的,所以在created钩子函数中做: var ...
（转）浅析epoll – epoll例子以及分析
原文地址:http://www.cppfans.org/1419.html 浅析epoll – epoll例子以及分析上篇我们讲到epoll的函数和性能.这一篇用用这些个函数,给出一个最简单的epo ...
神器cut基因剪
cut cut 不就是切嘛,没错就是它--我给他起了一个外号基因剪刀来我们学一下怎么使用这个命令 cut --help [root@ESProbe ~]# cut --help Usage: cut ...
C#winform如何主窗口最大化最小化默认大小
this.WindowState = FormWindowState.Minimized; bool b = true; private void button2_Click(object sende ...
[剑指offer]10.斐波那契数列+青蛙跳台阶问题
10- I. 斐波那契数列方法一 Top-down 用递归实现 def fibonacci(n): if n <= 0: return 0 if n == 1: return 1 return ...
Remmina
什么是Remmina? Remmina作为一个远程连接服务器,可以方便快捷的帮你连接服务器,不用直接使用命令行的方式去连接服务器,使用也很简单.具体下载直接在APP中下载就好,Linux自带这个软件, ...

python--爬虫之JSON于JsonPath

JSON

json的引入

json模块的功能

JsonPath

JsonPath的引入

JsonPath的使用

实例

python--爬虫之JSON于JsonPath的更多相关文章

随机推荐

热门专题