前言

  本文主要从sharding最新版本5.1.2版本入手搭建,按主键ID和时间进行分表。

  本文主要介绍搭建过程,有兴趣了解shardingsphere的同学可以先自行查阅相关资料。

  shardsphere官网:https://shardingsphere.apache.org/index_zh.html(建议下载master文档进行学习)

  github地址:https://github.com/apache/shardingsphere.git

  gitee地址:https://gitee.com/Sharding-Sphere/sharding-sphere.git

正文

  这里搭建的框架采用 springboot2 + shardingsphere5 + mybatisplus(不用写sql) + mysql(druid连接池)

1、初始化SQL脚本(需要的自行前往文末项目地址获取)

●  示例中有user表和order表,user表按id分片,order表按时间进行年月分片。

●  注意:分表需要自行预创建,这里建议写个执行器创建

2、项目引入pom依赖(这里选的版本未发现冲突)

<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
</dependency> <dependency>
<groupId>mysql</groupId>
<artifactId>mysql-connector-java</artifactId>
</dependency>
<dependency>
<groupId>org.projectlombok</groupId>
<artifactId>lombok</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-configuration-processor</artifactId>
</dependency>
<dependency>
<groupId>org.apache.shardingsphere</groupId>
<artifactId>shardingsphere-jdbc-core-spring-boot-starter</artifactId>
<version>5.1.2</version>
</dependency> <dependency>
<groupId>org.mybatis.spring.boot</groupId>
<artifactId>mybatis-spring-boot-starter</artifactId>
<version>2.2.2</version>
</dependency>
<dependency>
<groupId>com.baomidou</groupId>
<artifactId>mybatis-plus-boot-starter</artifactId>
<version>3.5.2</version>
</dependency>
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>druid</artifactId>
<version>1.2.11</version>
</dependency>

maven依赖

3、进行yml配置

●  需要加上spring.shardingsphere.props.sql-show = true , 打印sharding执行的sql,便于观察理解分表的原理,生产环境可选择关闭。

●  这里主要是用order表根据年月进行分表,因考虑到需要兼容历史表,所以这里逻辑分表需包含历史表名,具体看配置项actual-data-nodes。

●  一般建议跨两个表进行查询,比如这里是按照月份分表,则建议限制查询时间跨度最大为一个月,这样最多跨两个逻辑分表进行查询,性能会提高很多。

spring:
application:
name: demo-shardingsphere
shardingsphere:
# 打印执行sql
props:
sql-show: true
# 数据源配置
datasource:
names: test
test:
type: com.alibaba.druid.pool.DruidDataSource
driverClassName: com.mysql.cj.jdbc.Driver
url: jdbc:mysql://localhost:3306/ss_test?serverTimezone=UTC&useSSL=false&useUnicode=true&characterEncoding=UTF-8
username: root
password: root
# 分片规则
rules:
sharding:
# 分片策略
sharding-algorithms:
# 自定义分片策略
order_inline:
type: class_based
props:
strategy: standard
algorithmClassName: com.demo.config.sharding.algorithm.OrderTableAlgorithm
tables:
# 需要进行分片的逻辑表名前缀
t_order:
# 逻辑分表
actual-data-nodes: test.t_order,test.t_order_$->{2022..2025}0$->{1..9},test.t_order_$->{2022..2025}1$->{0..2}
table-strategy:
standard:
# 分表的字段
sharding-column: create_date
# 自定义的分片策略名
sharding-algorithm-name: order_inline # 下面是按主键进行分表,规则比较简单,自定义表达式即可
# sharding-algorithms:
# user_inline:
# type: inline
# props:
# algorithm-expression: user_$->{id % 2}
# tables:
# user:
# actual-data-nodes: test.user_$->{0..1}
# table-strategy:
# standard:
# sharding-column: id
# sharding-algorithm-name: user_inline
# key-generate-strategy:
# column: id
# key-generator-name: snowflake
# key-generators:
# snowflake:
# type: SNOWFLAKE server:
port: 8889 # 定义跨表时间查询范围,小于min时间,则联查历史表,不允许大于max时间,具体可看自定义的分片策略实现
sharding:
table:
user:
base:
date:
min: 2022-08-01 00:00:00
max: 2023-01-31 23:59:59 #logging:
# level:
# com.demo.mapper: debug

配置文件

4、自定分片策略

●  这里采用jdk8的新时间特性LocalDateTime,需要与定义的分表字段类型对应上。

●  sharding5使用了新的分片对象(5之前使用PreciseShargingAlgorithm),查询和插入都可以在一个对象里配置。

●  考虑到有些项目已经是在线上运行的项目,需要兼容历史表,这里配置中做了判断,需自行配置分表投产的时间作为区分,历史表数据不动,新数据采用分表插入和查询。

    private static final DateTimeFormatter dateFormatter = DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss");
private static final DateTimeFormatter monthFormatter = DateTimeFormatter.ofPattern("yyyyMM"); /**
* 获取查询对应分表名
* @param collection
* @param preciseShardingValue
* @return
*/
@Override
public String doSharding(Collection<String> collection, PreciseShardingValue<LocalDateTime> preciseShardingValue) {
LocalDateTime date = preciseShardingValue.getValue();
if (date == null) {
return collection.stream().findFirst().get();
} String tableName = preciseShardingValue.getLogicTableName(); // 如果查询范围包括基础表,则需要联合基础表进行查询
LocalDateTime minBaseDate = LocalDateTime.parse(StaticValue.userBaseTableMinDate, dateFormatter);
if (date.isAfter(minBaseDate)) {
String tableSuffix = date.format(monthFormatter);
tableName = tableName.concat("_").concat(tableSuffix);
} String t = tableName;
return collection.stream().filter(str -> str.equals(t)).findFirst().orElseThrow(() -> new RuntimeException(t + "分表不存在"));
} /**
* 范围查询获取所有分表
*
* @param collection
* @param rangeShardingValue
* @return 分表集合
*/
@Override
public Collection<String> doSharding(Collection collection, RangeShardingValue rangeShardingValue) { String logicTableName = rangeShardingValue.getLogicTableName();
Range<LocalDateTime> valueRange = rangeShardingValue.getValueRange();
Set<String> tableRange = extracted(logicTableName, valueRange.lowerEndpoint(), valueRange.upperEndpoint()); return tableRange;
} /**
* 根据时间范围获取分表集合
*
* @param logicTableName
* @param lowerEndpoint
* @param upperEndpoint
* @return
*/
private Set<String> extracted(String logicTableName, LocalDateTime lowerEndpoint, LocalDateTime upperEndpoint) {
Set<String> rangeTable = new HashSet<>(); // 如果查询范围包括基础表,则需要联合基础表进行查询
LocalDateTime minBaseDate = LocalDateTime.parse(StaticValue.userBaseTableMinDate, dateFormatter);
LocalDateTime maxBaseDate = LocalDateTime.parse(StaticValue.userBaseTableMaxDate, dateFormatter); if (lowerEndpoint.isBefore(minBaseDate)) {
lowerEndpoint = minBaseDate;
rangeTable.add(logicTableName);
}
if (upperEndpoint.isAfter(maxBaseDate)) {
throw new RuntimeException("结束时间不在当前时间内");
} // 便利所有分表
while (lowerEndpoint.isBefore(upperEndpoint)) {
String tableName = logicTableName.concat("_").concat(lowerEndpoint.format(monthFormatter));
rangeTable.add(tableName);
lowerEndpoint = lowerEndpoint.plusMonths(1);
} // 可能开始时间累加后与结束时间一致
String tableName = logicTableName.concat("_").concat(upperEndpoint.format(monthFormatter));
rangeTable.add(tableName); return rangeTable;
}

5、自定义接口测试

●  接口定义请自行参考文末项目源码,这里直接上测试结果图

测试场景一:插入一条2022年10月份数据

sharding运行过程

执行结果,插入到表t_order_202210

测试场景二:范围查找2022-07-01至2022-12-01

sharding执行过程

执行结果,可以观察到我们刚插入的数据,另外一条是之前测试插入的

至此,本片文章结束,有兴趣的同学可以一起讨论,谢谢。

有兴趣可参考完整项目地址:https://gitee.com/yhc910/demo-shardingsphere

实战注意点(实时更新):

1、druid连接池属性,jdbc-url改为url

2、sharding-algorithm-name,注意algorithm后面不要加s,后面debug源码才找到问题

3、数据源配置url后面的属性,不要连着两个&&,不然会报错无效数组

ShardingSphere实战的更多相关文章

  1. 图灵学院JAVA互联网架构师专题学习笔记

    图灵学院JAVA互联网架构师专题学习笔记 下载链接:链接: https://pan.baidu.com/s/1xbxDzmnQudnYtMt5Ce1ONQ 密码: fbdj如果失效联系v:itit11 ...

  2. ShardingSphere 集成 CosId 实战

    背景 在软件系统演进过程中,随着业务规模的增长 (TPS/存储容量),我们需要通过集群化部署来分摊计算.存储压力. 应用服务的无状态设计使其具备了伸缩性.在使用 Kubernetes 部署时我们只需要 ...

  3. 数据量大了一定要分表,分库分表组件Sharding-JDBC入门与项目实战

    最近项目中不少表的数据量越来越大,并且导致了一些数据库的性能问题.因此想借助一些分库分表的中间件,实现自动化分库分表实现.调研下来,发现Sharding-JDBC目前成熟度最高并且应用最广的Java分 ...

  4. Java实战:教你如何进行数据库分库分表

    摘要:本文通过实际案例,说明如何按日期来对订单数据进行水平分库和分表,实现数据的分布式查询和操作. 本文分享自华为云社区<数据库分库分表Java实战经验总结 丨[绽放吧!数据库]>,作者: ...

  5. Apache ShardingSphere 在京东白条场景的落地之旅

    京东白条使用 Apache ShardingSphere 解决了千亿数据存储和扩容的问题,为大促活动奠定了基础. 2014 年初,"京东白条"作为业内互联网信用支付产品,数据量爆发 ...

  6. DistSQL:像数据库一样使用 Apache ShardingSphere

    Apache ShardingSphere 5.0.0-beta 深度解析的第一篇文章和大家一起重温了 ShardingSphere 的内核原理,并详细阐述了此版本在内核层面,特别是 SQL 能力方面 ...

  7. 重磅|Apache ShardingSphere 5.0.0 即将正式发布

    Apache ShardingSphere 5.0.0 GA 版在经历 5.0.0-alpha 及 5.0.0-beta 接近两年时间的研发和打磨,终于将在 11 月份与大家正式见面! 11 月 10 ...

  8. 如何在 ShardingSphere 中开发自己的 DistSQL

    在<DistSQL:像数据库一样使用 Apache ShardingSphere>和<SCTL 涅槃重生:投入 RAL 的怀抱>中,已经为大家介绍了 DistSQL 的设计初衷 ...

  9. ShardingSphere 云上实践:开箱即用的 ShardingSphere-Proxy 集群

    本次 Apache ShardingSphere 5.1.2 版本更新为大家带来了三大全新功能,其中之一即为使用 ShardingSphere-Proxy chart 在云环境中快速部署一套 Shar ...

  10. ShardingSphere数据分片

    码农在囧途 坚持是一件比较难的事,坚持并不是自欺欺人的一种自我麻痹和安慰,也不是做给被人的,我觉得,坚持的本质并没有带着过多的功利主义,如果满是功利主义,那么这个坚持并不会长久,也不会有好的收获,坚持 ...

随机推荐

  1. Python基础 - 第一个python程序

    Python程序是什么? Python源程序就是一个特殊格式的文本文件,可以使用任意文本编辑器软件做python的开发,python的文件扩展名为 .py 执行python程序的三种方式 直接调用解释 ...

  2. 烂怂if-else代码优化方案

    0.问题概述 代码可读性是衡量代码质量的重要标准,可读性也是可维护性.可扩展性的保证,因为代码是连接程序员和机器的中间桥梁,要对双边友好.Quora 上有一个帖子: "What are so ...

  3. IntelliJ IDEA 的初次使用--/护头

    IntelliJ IDEA 的使用 使用前先完成以下两点 环境配置 Win10环境配置(二) --Java篇 软件安装 IntelliJ IDEA 的安装 在完成软件安装,打开软件的瞬间,我是懵逼的. ...

  4. JIRA安装

    JIRA安装 操作系统: 阿里云centos6.8 域名: yan.jzhsc.com 1.安装与配置JAVA sudo -u root -H bash # 在oracle官网下载JDK,安装并配置环 ...

  5. 使用hashicorp Raft开发分布式服务

    使用hashicorp Raft开发高可用服务 开发raft时用到的比较主流的两个库是Etcd Raft 和hashicorp Raft,网上也有一些关于这两个库的讨论.之前分析过etcd Raft, ...

  6. 深入分析Go语言与C#的异同

    摘要:本文由葡萄城技术团队于博客园原创并首发.转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 前言 为了更加深入地介绍Go语言以及与C#语言的比较,本文将会 ...

  7. Unparseable date: "2019-03-27"

    Unparseable date: "2 public static void main(String[] args) { try { String dateStr="2019-0 ...

  8. java.lang.IndexOutOfBoundsException

    原因:一个ArrayList数组中没有元素,而你想获取第一个元素,运行是就会报此类型的错误 解决方案:用 array[] 的  .length 查看 数组的长度

  9. mysql高级进阶(存储过程、游标、触发器)

    废话不多说,直接进入正题... 一.存储过程 a.概述 存储过程可以看成是对一系列 SQL 操作的批处理: 使用存储过程的好处 代码封装,保证了一定的安全性: 代码复用: 由于是预先编译,因此具有很高 ...

  10. AcWing 4486. 数字操作题解

    题目描述 给定一个整数 \(n\),你可以对该数进行任意次(可以是 \(0\) 次)变换操作. 每次操作为以下两种之一: 将整数 \(n\) 乘以任意一个正整数 \(x\). 将整数 \(n\) 替换 ...