MySQL 的 JSON 路径格式

MySQL 使用特定的 JSON 路径表达式语法来导航和提取 JSON 文档中的数据

基本结构

MySQL 中的 JSON 路径遵循以下通用格式

$[路径组件]

路径组件详解

| 操作符       | 描述      | 示例                  |
| ----------- | --------- | --------------------- |
| $ \| 根对象 \| $ |
| . 或 [] | 成员访问 | $.name 或 $['name'] |
| [*] | 数组通配符 | $.items[*] |
| [n] | 数组索引 | $[0] |
| [m to n] | 数组范围 | $[1 to 3] |
| ** | 递归通配符 | $**.price |

1. 根对象 ($)

  • $ 表示整个 JSON 文档

2. 成员访问 (.[])

  • 点号表示法:$.store.book
  • 括号表示法:$['store']['book']
  • 当键名包含特殊字符或空格时使用括号表示法

3. 数组访问

  • 所有元素:$[*]$.array[*]
  • 指定索引:$[0] 计数是从0开始
  • 范围:$[1 to 3](MySQL 8.0.26+)

4. 通配符

  • * 匹配当前层级所有成员/元素
  • ** 递归搜索所有路径(MySQL 8.0.26+)

特殊语法元素

1. 过滤表达式 (MySQL 8.0.4+)

$.items[?(@.price > 10)]
  • ? 引入过滤表达式
  • @ 表示当前元素

2. 路径范围 (MySQL 8.0.26+)

$[1 to 3]       // 第1到第3个元素
$[last-1] // 倒数第二个元素
$[last-2 to last] // 最后三个元素

实际示例

简单路径

-- 提取标量值
SELECT JSON_EXTRACT('{"name": "张三", "age": 30}', '$.name'); -- 数组元素, 输出 "b", 注意是带双引号的
SELECT JSON_EXTRACT('["a", "b", "c"]', '$[1]');

复杂路径

-- 嵌套对象
SELECT JSON_EXTRACT('{"store": {"book": {"title": "MySQL指南"}}}', '$.store.book.title'); -- 对象数组
SELECT JSON_EXTRACT('{"items": [{"id": 1}, {"id": 2}]}', '$.items[*].id');

过滤表达式

-- 查找高价商品
SELECT JSON_EXTRACT('{"items": [{"id": 1, "price": 5}, {"id": 2, "price": 15}]}',
'$..items[?(@.price > 10)].id');

简写操作符

MySQL 提供常用操作的简写形式

  • -> : 等同于 JSON_EXTRACT()
  • ->> : 等同于 JSON_UNQUOTE(JSON_EXTRACT())
-- 以下两种写法等价:
SELECT json_column->'$.name';
SELECT JSON_EXTRACT(json_column, '$.name'); -- 以下两种写法等价(返回去除引号的字符串):
SELECT json_column->>'$.name';
SELECT JSON_UNQUOTE(JSON_EXTRACT(json_column, '$.name'));

注意

  1. 路径表达式区分大小写
  2. 不存在的路径返回 NULL(不会报错)
  3. ** 递归操作符可能影响性能
  4. 过滤表达式支持比较运算符:=!=<>

MySQL 的 JSON_TABLE 函数

使用过 JSON_EXTRACT 函数都知道, 这样获取的结果还不是真正的行列结构, MySQL 8.0 引入的 JSON_TABLE 函数可以将 JSON 数据转换为关系型表格格式, 将数组中的每个元素转换成表格中的一行数据.

JSON_TABLE 的功能

  1. 将 JSON 数组展开为多行记录
  2. 提取嵌套的 JSON 对象属性
  3. 将半结构化数据转为结构化数据

JSON_TABLE 用法

JSON_TABLE(
json_doc, -- JSON 类型的字段或值
path_expression -- JSON 路径表达式
COLUMNS( -- 新表的列定义
column_name column_type PATH json_path [on_empty] [on_error],
...
)
) [AS] alias

参数说明

  1. json_doc:可以是 JSON 字符串字面量, 或者表中的 JSON 类型列
  2. path_expression:指向要展开的 JSON 数组的路径
  3. COLUMNS:定义输出列的结构
    • column_name:生成的列名
    • column_type:数据类型(如 VARCHAR, INT, JSON 等)
    • PATH:指定数据提取路径
  4. alias:必须提供的表别名

实际案例

将整数数组展开为一列多行

SELECT *
FROM JSON_TABLE(
'[1, 2, 3]',
'$[*]' COLUMNS(
rowid FOR ORDINALITY,
value INT PATH '$'
)
) AS t;

输出

rowid | value
------+-------
1 | 1
2 | 2
3 | 3

将对象数组展开为多列多行

SELECT *
FROM JSON_TABLE(
'[{"name":"张三","age":25},{"name":"李四","age":30}]',
'$[*]' COLUMNS(
name VARCHAR(20) PATH '$.name',
age INT PATH '$.age',
adult VARCHAR(3) PATH '$.age' DEFAULT '否' ON EMPTY
)
) AS t;

输出

name | age | adult
-----+-----+------
张三 | 25 | 否
李四 | 30 | 否

在数据表中展开

如果JSON是表中的一个字段, 可以使用 table_1 CROSS JOIN JSON_TABLE(...) 展开, 例如一个表 v_video 的字段 result 为 JSON 字段, 需要展开 result 中的一个成员 sequences, 写成SQL如下

SELECT
e.id,
e.match_id,
e.result->>'$.id' AS json_id,
j.tag->>'$.sf' AS sf_value,
j.tag->>'$.ef' AS ef_value,
j.tag->>'$.ef' - j.tag->>'$.sf'AS duration
FROM
v_video e
CROSS JOIN JSON_TABLE(
e.result->'$.sequences',
'$[*]' COLUMNS (
tag JSON PATH '$'
)
) AS j ON e.match_id = 294

上面的SQL, 通过 CROSS JOIN JSON_TABLE 将每一行 e.result 字段下的 sequences 数组展开, 每个数组元素成为新字段 tag, 这时候还是一个 JSON, 然后在SELECT 中通过->>抽取其中的值, 得到完全展开的一个新表.

高级用法

FOR ORDINALITY 子句

生成自增的行号列

COLUMNS(
id FOR ORDINALITY,
...
)

嵌套路径处理

COLUMNS(
NESTED PATH '$.nested_obj' COLUMNS(
sub_col1 INT PATH '$.prop1',
sub_col2 VARCHAR(10) PATH '$.prop2'
)
)

上面的例子用嵌套可以改写为

SELECT
j.id,
j.sf,
j.ef,
j.ef - j.sf AS duration
FROM
v_video e
CROSS JOIN
JSON_TABLE(
e.result->'$.sequences',
'$[*]' COLUMNS (
id FOR ORDINALITY,
NESTED PATH '$' COLUMNS(
ef INT PATH '$.ef',
sf INT PATH '$.sf'
)
)
) AS j ON e.match_id = 294

上面的SQL, 通过 NESTED PATH ... COLUMNS(...) 将展开后数组中的一个JSON元素进一步展开为多个字段.

错误处理

COLUMNS(
ef INT PATH '$.ef' NULL ON EMPTY NULL ON ERROR,
sf INT PATH '$.sf' DEFAULT '0' ON EMPTY NULL ON ERROR
)

格式是

on_empty:
{NULL | DEFAULT json_string | ERROR} ON EMPTY on_error:
{NULL | DEFAULT json_string | ERROR} ON ERROR

注意事项

  1. MySQL 版本要高于8.0
  2. 路径表达式必须指向 JSON 数组, 注意是数组
  3. 必须为结果集指定别名
  4. 在 FROM 子句和 JOIN 子句中都可以使用
  5. 在性能上, 对大数据集使用 JSON_TABLE 可能较慢, 可以为 JSON 列创建函数索引提高查询性能

MySQL 的 JSON 查询的更多相关文章

  1. MySQL全文索引、联合索引、like查询、json查询速度大比拼

    目录 查询背景 一.like查询 二.json函数查询 三.联合索引查询 四.全文索引查询 结论 查询背景 有一个表tmp_test_course大概有10万条记录,然后有个json字段叫outlin ...

  2. 【MySQL】分页查询实例讲解

    MySQL分页查询实例讲解 1. 前言 本文描述了团队在工作中遇到的一个MySQL分页查询问题,顺带讲解相关知识点,为后来者鉴.本文的重点不是"怎样"优化表结构和SQL语句,而是探 ...

  3. Mysql解析json字符串/数组

    1 Mysql解析json字符串  解决方法:JSON_EXTRACT(原字段,'$.json字段名') 执行SQL: SELECT JSON_EXTRACT( t.result,'$.row'), ...

  4. mybatis&plus系列------Mysql的JSON字段的读取和转换

    mybatis&plus系列------Mysql的JSON字段的读取和转换 一. 背景 在平常的开发中,我们可能会有这样的需求: 业务数据在存储的时候,并不是以mysql中的varchar丶 ...

  5. mysql 的 json 类型

    MySQL的 json 数据类型 MySQL5.7 后的版本,添加了对于 json 类型的支持.此前,json 类型的数据,只能在代码层面做 json.loads() 和 json.dumps() 操 ...

  6. 步步深入:MySQL架构总览->查询执行流程->SQL解析顺序

    前言: 一直是想知道一条SQL语句是怎么被执行的,它执行的顺序是怎样的,然后查看总结各方资料,就有了下面这一篇博文了. 本文将从MySQL总体架构--->查询执行流程--->语句执行顺序来 ...

  7. MySQL 清空慢查询文件

    标签:配置慢查询 概述 本章主要写当慢查询文件很大的时候怎样在线生成一个新的慢查询文件. 测试环境:mysql 5.6.21 步骤 配置慢查询 默认的my.cnf文件在/etc/目录下 vim /et ...

  8. PHP慢脚本日志和Mysql的慢查询日志

    1.PHP慢脚本日志 间歇性的502,是后端 PHP-FPM 不可用造成的,间歇性的502一般认为是由于 PHP-FPM 进程重启造成的. 在 PHP-FPM 的子进程数目超过的配置中的数量时候,会出 ...

  9. MySQL知识树-查询语句

    在日常的web应用开发过程中,一般会涉及到数据库方面的操作,其中查询又是占绝大部分的.我们不仅要会写查询,最好能系统的学习下与查询相关的知识点,这篇随笔我们就来一起看看MySQL查询知识相关的树是什么 ...

  10. MySql的连接查询

    类似于oracle的连接查询,mysql连接查询也有左外连接.右外连接.内连接查询.但是,不同的是没有直接 的全外连接查询. 这里介绍MySql的连接查询: 这里已两张表为例:STUDENT 表 和 ...

随机推荐

  1. 飞书lark机器人 自动化发版

    飞书lark机器人 自动化发版 #1 介绍 开发飞书机器人接收消息并调用构建接口, 实现自动化发版 发送指令 -> 机器人接收指令 -> 调用jenkins-job远程构建与部署 jenk ...

  2. 《深入理解Mybatis原理》MyBatis的sqlSession执行流程

    sqlSessionFactory 与 SqlSession 正如其名,Sqlsession对应着一次数据库会话.由于数据库会话不是永久的,因此Sqlsession的生命周期也不应该是永久的,相反,在 ...

  3. ANOSIM分析

    ANOSIM分析(analysis of similarities)即相似性分析,主要用于分析高维数据组间相似性,为数据间差异显著性评价提供依据.在一些高维数据分析中,需要使用PCA.PCoA.NMD ...

  4. Solution -「JZOJ #5457」项链

    \(\mathscr{Description}\)   Private link.   给定一条有 \(n\) 个点的圆环和 \(m\) 中颜色, 求在位置旋转, 位置翻转, 颜色旋转等价的意义下, ...

  5. 利用mybatis拦截器记录sql,辅助我们建立索引(一)

    背景 由于现在的工作变成了带别的小伙子一起做项目,就导致,整个项目中的代码不再全部都是自己熟悉的,可能主要是熟悉其中的部分代码. 但是最终项目上线,作为技术责任人,线上出任何问题,我都有责任(不管是不 ...

  6. w3cschool-Linux shell教程

    Shell 教程 Shell 是一个用 C 语言编写的程序,它是用户使用 Linux 的桥梁.Shell 既是一种命令语言,又是一种程序设计语言. Shell 是指一种应用程序,这个应用程序提供了一个 ...

  7. Java线程的通信

    当需要多个线程共同完成一件任务,而且需要有规律的执行,那么多个线程之间需要一定的通信机制,可以协调他们的工作,以此实现多线程共同操作一份数据. 1 等待唤醒机制 这是一种线程间的协作机制,与争夺锁的竞 ...

  8. JavaScript 中的组合继承 :ES5 与 ES6 中最近似的写法

    JavaScript 的继承写法较多,在此并不一一讨论,仅对最常用的组合式继承做一个说明: 组合式继承主要利用了原型链继承和构造函数继承. 一.ES5 中的写法 function Person(nam ...

  9. 正确停止Oracle expdp/impdp作业操作方法

    1.使用命令查看在运行的作业名称,找到STATE是EXECUTING的作业名称. select job_name,state from dba_datapump_jobs; 2.再CMD命令窗口,键入 ...

  10. Oracle 遍历游标的四种方式汇总(for、fetch、while、BULK COLLECT)

    本文原创:https://www.cnblogs.com/Marydon20170307/p/12869692.html 感谢博主分享 注意:原文中方式四FORALL处有语法错误,应该使用FOR. 1 ...