在电商系统中,我们总是会遇到一些树形结构数据的存储需求。如地理区域、位置信息存储,地理信息按照层级划分,会分为很多层级,就拿中国的行政区域划分为例,简单的省-市-县-镇-村就要五个级别。如果系统涉及到跨境的国际贸易,那么存储的地理信息层级会更加深。那么如何正确合理地存储这些数据,并且又能很好的适应各种查询场景就成了我们需要考虑的问题,这次我们来考虑通过闭包表方案,来达到我们的存储及查询需求。

一、设计闭包表

闭包表由Closure Table翻译而来,通过父节点、子节点、两节点距离来描述一棵树空间换时间的思想,Closure Table,一种更为彻底的全路径结构,分别记录路径上相关结点的全展开形式。能明晰任意两结点关系而无须多余查询,级联删除和结点移动也很方便。但是它的存储开销会大一些,除了表示结点的Meta信息,还需要一张专用的关系表。

区域基础信息表结构如下

CREATE TABLE `area_base` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
`area_name` varchar(50) NOT NULL COMMENT '区域名称',
`sequence` int(11) DEFAULT NULL COMMENT '排序号,越小越靠前',
`created_by` bigint(20) NOT NULL COMMENT '创建人',
`created_time` bigint(20) NOT NULL COMMENT '创建时间',
`updated_by` bigint(20) DEFAULT NULL COMMENT '更新人',
`updated_time` bigint(20) NOT NULL DEFAULT '0' COMMENT '更新时间',
`is_del` tinyint(2) NOT NULL DEFAULT '0' COMMENT '状态:0 正常,-1 已删除',
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=56 DEFAULT CHARSET=utf8mb4 COMMENT='区域表';

区域之间指向关系的闭包表结构如下

CREATE TABLE `area_closure` (
`id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '自增长Id',
`ancestor` bigint(20) NOT NULL COMMENT '祖先',
`descendant` bigint(20) NOT NULL COMMENT '后代',
`distance` int(11) DEFAULT NULL COMMENT '祖先到后代之间的距离',
PRIMARY KEY (`id`),
UNIQUE KEY `id_ancedesc` (`ancestor`,`descendant`) USING BTREE,
KEY `idx_ancestor` (`ancestor`,`distance`) USING BTREE,
KEY `idx_descendant` (`descendant`,`distance`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=259 DEFAULT CHARSET=utf8mb4 COMMENT='区域的树形结构闭包表';

模拟一些示范数据,如下所示

mysql> select * from area_base;
+----+-----------+----------+------------+----------------+------------+---------------+--------+
| id | area_name | sequence | created_by | created_time | updated_by | updated_time | is_del |
+----+-----------+----------+------------+----------------+------------+---------------+--------+
| 1 | 根节点 | 0 | 123 | 15679841561561 | 990 | 1539175879690 | 0 |
| 29 | 亚洲 | 96 | 123 | 15679841561561 | 990 | 1540031478909 | 0 |
| 30 | 美洲 | 33 | 123 | 15679841561561 | 990 | 1540031478923 | 0 |
| 31 | 欧洲 | 0 | 123 | 15679841561561 | 990 | 1539175879690 | 0 |
| 35 | 中国 | 0 | 123 | 15679841561561 | 990 | 1539175879690 | 0 |
| 36 | 日本 | 0 | 123 | 15679841561561 | 990 | 1539175879690 | 0 |
| 37 | 朝鲜 | 0 | 123 | 15679841561561 | 990 | 1539175879690 | 0 |
| 38 | 广东省 | 0 | 123 | 15679841561561 | 990 | 1539175879690 | 0 |
| 39 | 新疆省 | 0 | 123 | 15679841561561 | 990 | 1539175879690 | 0 |
| 40 | 广西省 | 0 | 123 | 15679841561561 | 990 | 1539175879690 | 0 |
| 41 | 深圳市 | 0 | 123 | 15679841561561 | 990 | 1539175879690 | 0 |
| 42 | 广州市 | 0 | 123 | 15679841561561 | 990 | 1539175879690 | 0 |
| 43 | 佛山市 | 0 | 123 | 15679841561561 | 990 | 1539175879690 | 0 |
+----+-----------+----------+------------+----------------+------------+---------------+--------+
13 rows in set

二、闭包表中的递归操作

如何递归构造出一颗全区域的返回树

    public AreaTreeResponse getAreaTree(Long areaId) {
String cacheKey = BasicConst.Cache.AREA_TREE_KEY + BasicConst.AreaInfo.ROOT_NODE_ID;
AreaTreeResponse areaTreeResponse = cache.get(cacheKey);
if(areaTreeResponse != null){
return areaTreeResponse;
}
// 递归生成
areaTreeResponse = newAreaTreeByRecur(areaId);
// 加入缓存,并设置超时时间
cache.set(cacheKey, areaTreeResponse, BasicConst.Cache.AREA_CACHE_TTL);
return areaTreeResponse;
}
/**
* 根据父节点构造返回子树
*
* @param parentId
* @return
*/
private AreaTreeResponse newAreaTreeByRecur(Long parentId){
// 初始化返回结果
AreaTreeResponse areaTree = new AreaTreeResponse();
// 获取直接子节点
List<AreaTree> areaChildList = areaClosureMapper.getAreaTree(parentId, 1);
if(areaChildList == null || areaChildList.size() == 0){
return areaTree;
} else {
// 初始化当前节点的id和name
Long curNodeId = null;
String curNodeName = null;
// 初始化当前节点对应的childList
List<AreaTreeResponse> childList = new ArrayList<>();
for (AreaTree areaChildNode : areaChildList) {
curNodeId = areaChildNode.getParentId();
curNodeName = areaChildNode.getParentName();
// 递归,将子节点当成父节点向下递归
AreaTreeResponse child = newAreaTreeByRecur(areaChildNode.getChildrenId());
// 叶子节点设置child
child.setAreaId(areaChildNode.getChildrenId());
child.setAreaName(areaChildNode.getChildrenName());
childList.add(child);
}
// 将childList传给上一节点
areaTree.setAreaId(curNodeId);
areaTree.setAreaName(curNodeName);
areaTree.setChildren(childList);
return areaTree;
}
}

写一个测试用例进行测试

@Test
public void getCurrentNodeTree(){
AreaTreeResponse areaTreeResponse = areaService.getAreaTree(1L);
// 模拟返回树
String jsonObject = JSONObject.toJSONString(areaTreeResponse);
System.out.println("lingyejun test result :"+jsonObject);
}

递归生成的树状Json如下

{
"areaId":1,
"areaName":"根节点",
"children":[
{
"areaId":31,
"areaName":"欧洲"
},
{
"areaId":30,
"areaName":"美洲"
},
{
"areaId":29,
"areaName":"亚洲",
"children":[
{
"areaId":35,
"areaName":"中国",
"children":[
{
"areaId":38,
"areaName":"广东省",
"children":[
{
"areaId":41,
"areaName":"深圳市"
},
{
"areaId":42,
"areaName":"广州市"
},
{
"areaId":43,
"areaName":"佛山市"
}
]
},
{
"areaId":39,
"areaName":"新疆省"
},
{
"areaId":40,
"areaName":"广西省"
}
]
},
{
"areaId":36,
"areaName":"日本"
},
{
"areaId":37,
"areaName":"朝鲜"
}
]
}
]
}

参考文章:https://www.biaodianfu.com/closure-table.html  

Mysql闭包表之关于国家区域的一个实践的更多相关文章

  1. mysql 数据表备份导出,恢复导入操作实践

    因为经常跑脚本的关系, 每次跑完数据之后,相关的测试服数据库表的数据都被跑乱了,重新跑脚本恢复回来速度也不快,所以尝试在跑脚本之前直接备份该表,然后跑完数据之后恢复的方式,应该会方便一点.所以实践一波 ...

  2. MySQL复制表结构和内容到另一个表中

    一:(低版本的mysql不支持,mysql4.0.25 不支持,mysql5已经支持了)1.复制表结构到新表CREATE TABLE 新表LIKE 旧表 2.复制旧表的数据到新表(假设两个表结构一样) ...

  3. 【转载】mysql建表date类型不能设置默认值

    如题,mysql建表date类型的不能设置一个默认值,比如我这样: CREATE TABLE `new_table` ( `biryhday` datetime NULL DEFAULT '1996- ...

  4. 用户中心mysql数据库表结构的脚本

    /* Navicat MySQL Data Transfer Source Server : rm-m5e3xn7k26i026e75o.mysql.rds.aliyuncs.com Source S ...

  5. mysql分表和表分区详解

    为什么要分表和分区? 日常开发中我们经常会遇到大表的情况,所谓的大表是指存储了百万级乃至千万级条记录的表.这样的表过于庞大,导致数据库在查询和插入的时候耗时太长,性能低下,如果涉及联合查询的情况,性能 ...

  6. 【mysql】mysql分表和表分区详解

    为什么要分表和分区? 日常开发中我们经常会遇到大表的情况,所谓的大表是指存储了百万级乃至千万级条记录的表.这样的表过于庞大,导致数据库在查询和插入的时候耗时太长,性能低下,如果涉及联合查询的情况,性能 ...

  7. MySQL 数据表操作

    MySQL 数据表操作 创建MySQL数据表需要以下信息: -表名: -表字段名: -定义每个表字段: 一.创建数据表 1)mysql> create  table  table_name (c ...

  8. 总结下Mysql分表分库的策略及应用

    上月前面试某公司,对于mysql分表的思路,当时简要的说了下hash算法分表,以及discuz分表的思路,但是对于新增数据自增id存放的设计思想回答的不是很好(笔试+面试整个过程算是OK过了,因与个人 ...

  9. MySQL 高性能表设计规范

    良好的逻辑设计和物理设计是高性能的基石, 应该根据系统将要执行的查询语句来设计schema, 这往往需要权衡各种因素. 一.选择优化的数据类型 MySQL支持的数据类型非常多, 选择正确的数据类型对于 ...

随机推荐

  1. os.walk的用法

    import os path = 'C:\\aa' for root,dirs,files in os.walk(path): print("Root=",root,'dirs=' ...

  2. ASP.NET Cookie概念、CURD操作、原理、实际运用

    会话就WEB开发来说,一个会话就是你通过浏览器与服务器之间的一次通话,只不过这种通话是以用浏览器浏览的方式来实现的. 就会话的应用来说,一般会话是用来识别用户的,比如你可以使用会话级变量记录当前用户已 ...

  3. centos 7.1开机/etc/rc.local脚本不执行的问题

    Centos 7.1中,/etc/rc.local是一个软链接文件.指向的是/etc/rc.d/rc.local 在Centos之前的版本我们都会将一些开机需要执行的命令加入到/etc/rc.loca ...

  4. vue---指令怎么写

    我们在考虑做一些功能性的封装的时候,我们会考虑使用vue的指令来做,那么指令应该怎么写: 具体参考: https://cn.vuejs.org/v2/guide/custom-directive.ht ...

  5. vue之用法

    一.安装 对于新手来说,强烈建议大家使用<script>引入 二. 引入vue.js文件 我们能发现,引入vue.js文件之后,Vue被注册为一个全局的变量,它是一个构造函数. 三.使用V ...

  6. DevOps的概念

    DevOps(英文Development和Operations的组合)是一组过程.方法与系统的统称,用于促进开发(应用程序/软件工程).技术运营和质量保障(QA)部门之间的沟通.协作与整合.它的出现是 ...

  7. 洛谷P2414 阿狸的打字机【AC自动机】【fail树】【dfs序】【树状数组】

    居然真的遇上了这种蔡队题.瑟瑟发抖. 题目背景 阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机. 题目描述 打字机上只有28个按键,分别印有26个小写英文字母和'B'.'P'两个字母.经阿 ...

  8. hdu4027Can you answer these queries?【线段树】

    A lot of battleships of evil are arranged in a line before the battle. Our commander decides to use ...

  9. 0000python中文乱码解决方案

    #!/usr/bin/env python # coding=utf-8

  10. maven配置(myeclipse版)

    使用环境说明: OS:windows 7 64位 java version: "jdk1.8.0_66" IDE:myeclipse 2017 1.下载 下载地址:http://m ...