一、ShardingContext

在Sharding-Jdbc中，我们其实需要抓住一个核心类，也就是ShardingContext，分片上下文，里面定义了下面几个内容：

@RequiredArgsConstructor

@Getter

public final class ShardingContext {

    //分片规则

    private final ShardingRule shardingRule;

    //数据库类型

    private final DatabaseType databaseType;

    //执行引擎

    private final ExecutorEngine executorEngine;

    //是否要在log文件中展示sql语句

    private final boolean showSQL;

}

里面的几个参数很简单易懂，但是里面包含的内容也是整个中间件的核心内容。

二、preparedStatement

这块对应于代码中的jdbc/core/statement，里面包括两部分，一部分是statement，一部分是prepareStatement。考虑到性能问题（prepareStatement可以进行缓存）和代码的优雅性（变量的设置），以及考虑到通常JDBC使用的都是prepareStatement，所以我们着重看下prepareStatement的两部分，即MasterSlavePreparedStatement和ShardingPreparedStatement。

2.1 MasterSlavePreparedStatement

2.1.1 获取connection

支持读写分离。这块可以先看一些他的构造方法，构造方法中一般都有这样的方法：

connection.getConnections(sqlStatement.getType())

这块其实是根据sql的类型，来获取不同的连接

如果是DDL类型，会获取所有的连接，包括master和slave，也就是说对于表结构的修改，会修改包括master和slave
如果是DML类型，也就是写操作，获取的是master的连接
最后，如果是DQL类型，也就是读操作，是根据读写分离的策略获取某个slave连接

后面两种是有本地缓存的，可以避免每次都进行connect构建，提高效率。

当然，这个sqlType是怎么来的？这就需要用到sql解析的模块了。

SQLStatement sqlStatement = new SQLJudgeEngine(sql).judge();

这块先提一下，后续再详细讲解。

2.1.2 执行sql

主要有三个方法，

executeQuery

public ResultSet executeQuery() throws SQLException {

    Preconditions.checkArgument(1 == routedStatements.size(), "Cannot support executeQuery for DDL");

    return routedStatements.iterator().next().executeQuery();

}

首先说明下，这里的routedStatements是待执行sql的一个集合，这块首先确保只有一个查询语句。然后直接调用PreparedStatement.executeQuery()方法，比较直观。

executeUpdate

public int executeUpdate() throws SQLException {

    int result = 0;

    for (PreparedStatement each : routedStatements) {

        result += each.executeUpdate();

    }

    return result;

}

这块逻辑与上面一致，不过不一样的是，可以传入多个update的语句，然后顺序执行，最后调用的是PreparedStatement.executeUpdate()方法。

execute

public boolean execute() throws SQLException {

    boolean result = false;

    for (PreparedStatement each : routedStatements) {

        result = each.execute();

    }

    return result;

}

最后就是一些其他的方法的执行了。

总的来说，读写分离这块的内容比较简单，首先sql语句不要怎么变化，再者数据库连接connection基本上都是确定的，所以不需要路由什么的，可以直接运行。

2.2 ShardingPreparedStatement

下面我们看下分库分表的情况下，来执行我们的sql，这块就稍微有些复杂了。

2.2.1 构造方法

首先看一下他的构造方法，构造方法中有一些很奇怪的常量，比如TYPE_FORWARD_ONLY、CONCUR_READ_ONLY等等，这块可以参考这篇博客。其实就是在读写过程中的指针的方向等内容。

2.2.2 sql执行

2.2.2.1 查询

查询的逻辑大概如下：

sql路由
sql改写
sql执行
结果合并

下面看下代码：

public ResultSet executeQuery() throws SQLException {

    ResultSet result;

    try {

        Collection<PreparedStatementUnit> preparedStatementUnits = route();

        List<ResultSet> resultSets = new PreparedStatementExecutor(

                getConnection().getShardingContext().getExecutorEngine(), routeResult.getSqlStatement().getType(), preparedStatementUnits, getParameters()).executeQuery();

        result = new ShardingResultSet(resultSets, new MergeEngine(resultSets, (SelectStatement) routeResult.getSqlStatement()).merge());

    } finally {

        clearBatch();

    }

    currentResultSet = result;

    return result;

}

首先我们需要看几个类：

PreparedStatementUnit
- SQLExecutionUnit：包括dataSource和sql
- PreparedStatement

这个类，会用于最终我们到具体的数据库上执行sql，调用route方法，其实就是路由到具体的服务器上面。

private Collection<PreparedStatementUnit> route() throws SQLException {

    Collection<PreparedStatementUnit> result = new LinkedList<>();

    routeResult = routingEngine.route(getParameters());

    for (SQLExecutionUnit each : routeResult.getExecutionUnits()) {

        SQLType sqlType = routeResult.getSqlStatement().getType();

        Collection<PreparedStatement> preparedStatements;

        if (SQLType.DDL == sqlType) {

            preparedStatements = generatePreparedStatementForDDL(each);

        } else {

            preparedStatements = Collections.singletonList(generatePreparedStatement(each));

        }

        routedStatements.addAll(preparedStatements);

        for (PreparedStatement preparedStatement : preparedStatements) {

            replaySetParameter(preparedStatement);

            result.add(new PreparedStatementUnit(each, preparedStatement));

        }

    }

    return result;

}

这里面有个routeResult，其实就是根据入参路由到的数据库列表。这边有一个路由引擎，看下这边是怎么路由的：

public SQLRouteResult route(final List<Object> parameters) {

    if (null == sqlStatement) {

        sqlStatement = sqlRouter.parse(logicSQL, parameters.size());

    }

    return sqlRouter.route(logicSQL, parameters, sqlStatement);

}

这边有几个参数，

logicSQL：表示逻辑上的sql，因为业务使用时，写的sql其实是逻辑上的sql，用到的数据库和表也是逻辑库和逻辑表
parameters：传入的参数
sqlStatement：最终的sql语句

首先解析sql，然后路由。这边的解析还是老套路，但是如果解析出来的sql是insert，而且配置了自动生成key，那么会调用自动生成key的方法，生成key，放到对应的column下。解析这块后续再分析。下面我们看下路由：

@Override

public SQLRouteResult route(final String logicSQL, final List<Object> parameters, final SQLStatement sqlStatement) {

    SQLRouteResult result = new SQLRouteResult(sqlStatement);

    if (sqlStatement instanceof InsertStatement && null != ((InsertStatement) sqlStatement).getGeneratedKey()) {

        processGeneratedKey(parameters, (InsertStatement) sqlStatement, result);

    }

    //路由

    RoutingResult routingResult = route(parameters, sqlStatement);

    //重写sql

    SQLRewriteEngine rewriteEngine = new SQLRewriteEngine(shardingRule, logicSQL, databaseType, sqlStatement);

    boolean isSingleRouting = routingResult.isSingleRouting();

    if (sqlStatement instanceof SelectStatement && null != ((SelectStatement) sqlStatement).getLimit()) {

        processLimit(parameters, (SelectStatement) sqlStatement, isSingleRouting);

    }

    SQLBuilder sqlBuilder = rewriteEngine.rewrite(!isSingleRouting);

    if (routingResult instanceof CartesianRoutingResult) {

        for (CartesianDataSource cartesianDataSource : ((CartesianRoutingResult) routingResult).getRoutingDataSources()) {

            for (CartesianTableReference cartesianTableReference : cartesianDataSource.getRoutingTableReferences()) {

                result.getExecutionUnits().add(new SQLExecutionUnit(cartesianDataSource.getDataSource(), rewriteEngine.generateSQL(cartesianTableReference, sqlBuilder)));

            }

        }

    } else {

        for (TableUnit each : routingResult.getTableUnits().getTableUnits()) {

            result.getExecutionUnits().add(new SQLExecutionUnit(each.getDataSourceName(), rewriteEngine.generateSQL(each, sqlBuilder)));

        }

    }

    if (showSQL) {

        SQLLogger.logSQL(logicSQL, sqlStatement, result.getExecutionUnits(), parameters);

    }

    return result;

}

先看路由：

private RoutingResult route(final List<Object> parameters, final SQLStatement sqlStatement) {

    Collection<String> tableNames = sqlStatement.getTables().getTableNames();

    RoutingEngine routingEngine;

    //不涉及到具体的表，全路由

    if (tableNames.isEmpty()) {

        routingEngine = new DatabaseAllRoutingEngine(shardingRule.getDataSourceMap());

    } else if (1 == tableNames.size() || shardingRule.isAllBindingTables(tableNames) || shardingRule.isAllInDefaultDataSource(tableNames)) {

        routingEngine = new SimpleRoutingEngine(shardingRule, parameters, tableNames.iterator().next(), sqlStatement);

    } else {

        // TODO config for cartesian set

        routingEngine = new ComplexRoutingEngine(shardingRule, parameters, tableNames, sqlStatement);

    }

    return routingEngine.route();

}

这里涉及到一个bindingTable的概念，概念如下：指在任何场景下分片规则均一致的主表和子表。例：订单表和订单项表，均按照订单ID分片，则此两张表互为BindingTable关系。BindingTable关系的多表关联查询不会出现笛卡尔积关联，关联查询效率将大大提升。

这里最终返回的结果RoutingResult类似如下：

这里面有几种路由类，后续再详细分析。

获取到数据库表的路由信息后，就到了sql改写的过程。这里也有一个sql改写的引擎：++SQLRewriteEngine++。中间插入了一个判断，routingResult.isSingleRouting()，判断是否路由之后的DB只有一个。这里有个小的优化：如果是select语句，用到了limit，而且最终落到了单片上，那么sql语句是不会被重写的，通过rewrite方法也可以看出来，是和isSingleRouting取反的。

public SQLBuilder rewrite(final boolean isRewriteLimit) {

    SQLBuilder result = new SQLBuilder();

    if (sqlTokens.isEmpty()) {

        result.appendLiterals(originalSQL);

        return result;

    }

    int count = 0;

    sortByBeginPosition();

    for (SQLToken each : sqlTokens) {

        if (0 == count) {

            result.appendLiterals(originalSQL.substring(0, each.getBeginPosition()));

        }

        if (each instanceof TableToken) {

            appendTableToken(result, (TableToken) each, count, sqlTokens);

        } else if (each instanceof ItemsToken) {

            appendItemsToken(result, (ItemsToken) each, count, sqlTokens);

        } else if (each instanceof RowCountToken) {

            appendLimitRowCount(result, (RowCountToken) each, count, sqlTokens, isRewriteLimit);

        } else if (each instanceof OffsetToken) {

            appendLimitOffsetToken(result, (OffsetToken) each, count, sqlTokens, isRewriteLimit);

        } else if (each instanceof OrderByToken) {

            appendOrderByToken(result, count, sqlTokens);

        }

        count++;

    }

    return result;

}

执行完成这步之后，sql语句重写基本完成。如果路由结果涉及到笛卡尔积，还需要对sql进行进一步的重写，因为涉及到关联表。下面涉及到真正转化sql这部分，使用的方法是：rewriteEngine.generateSQL，涉及到sql中的逻辑库表替换为实际的库表，形成SQLExecutionUnit，添加到待执行的sql列表中，最终得到SQLRouteResult。至此，sql路由完成。回到ShardingPreparedStatement的route方法。遍历routeResult，形成预执行的statement集合。

再回到ShardingPreparedStatement的executeQuery()方法，route()得到了Collection，下面就到了真正要执行sql的步骤。

【源码解析】Sharding-Jdbc的执行过程（一）的更多相关文章

Flink 源码解析 —— JobManager 处理 SubmitJob 的过程
JobManager 处理 SubmitJob https://t.zsxq.com/3JQJMzZ 博客 1.Flink 从0到1学习 -- Apache Flink 介绍 2.Flink 从0到1 ...
Flink 源码解析 —— TaskManager 处理 SubmitJob 的过程
TaskManager 处理 SubmitJob 的过程 https://t.zsxq.com/eu7mQZj 博客 1.Flink 从0到1学习 -- Apache Flink 介绍 2.Flink ...
Netty 源码解析（九）: connect 过程和 bind 过程分析
原创申明:本文由公众号[猿灯塔]原创,转载请说明出处标注今天是猿灯塔“365篇原创计划”第九篇. 接下来的时间灯塔君持续更新Netty系列一共九篇 Netty 源码解析(一): 开始 Netty 源 ...
Mybatis源码解析1—— JDBC
在之前的文章中,我为大家介绍了 Mybatis 的详细用法,算是基础教程. 详细链接:Mybatis 基础教程言归正传,只懂基础可不行,接下来将给大家带来高阶的源码解析教程,从浅入深,通过源码解析, ...
Fabric1.4源码解析：客户端创建通道过程
在使用Fabric创建通道的时候,通常我们执行一条命令完成,这篇文章就解析一下执行这条命令后Fabric源码中执行的流程. peer channel create -o orderer.example ...
Netty源码解析 -- ChannelPipeline机制与读写过程
本文继续阅读Netty源码,解析ChannelPipeline事件传播原理,以及Netty读写过程. 源码分析基于Netty 4.1 ChannelPipeline Netty中的ChannelPip ...
Netty源码解析 -- ChannelOutboundBuffer实现与Flush过程
前面文章说了,ChannelHandlerContext#write只是将数据缓存到ChannelOutboundBuffer,等到ChannelHandlerContext#flush时,再将Cha ...
【转】aiohttp 源码解析之 request 的处理过程
[转自太阳尚远的博客:http://blog.yeqianfeng.me/2016/04/01/python-yield-expression/] 使用过 python 的 aiohttp 第三方库 ...
MyBatis源码解析（一）——执行流程
原创作品,可以转载,但是请标注出处地址:http://www.cnblogs.com/V1haoge/p/6603926.html 一.MyBatis简介 MyBatis框架是一种轻量级的ORM框架, ...

随机推荐

代理网络中安装tomcat的注意事项
搭建J2EE开发环境的时候,tomcat怎么都没办法访问主页面.主要的问题就是Network Error (tcp_error) 百度了半天也没搞明白,最后没办法,打算重装tomcat,便对照完整的安 ...
常见Map 及 ArrayList 是否有序总结
常见Map 及 ArrayList 是否有序总结说明:此处的排序是指: 1: 往集合中插入元素的顺序与遍历元素的顺序的关系: 2: 往对象中插入元素否会根据元素的大小排序 public cla ...
全局程序集缓存GAC
GAC中的所有的Assembly都会存放在系统目录"%winroot%\assembly下面.放在系统目录下的好处之一是可以让系统管理员通过用户权限来控制Assembly的访问. 目录:C: ...
Storyboard中ViewController加载的四种方式
这个总结来自于<Programming iOS 10>一书: 1.storyboard的初始化ViewController,通过方法instantiateInitialViewContro ...
unity零基础开始学习做游戏（五）看看你的完成度，进度条了解一下？
-------小基原创,转载请给我一个面子上回书说道,英雄和魔王都做完了,子弹也能发射了,就是不知道啥时候能干死魔王.那小基得做个血条来展示一下,他离死不远了(•౪• ) 其实血条也可以看作是进度条 ...
threesum
算法题问题描述:在一些给定的数中,找到三个数,他们相加的和是0,并且这三个数的组合是不能重复的例子: input [-1, 0, -1, 2, 1] Output [[-1, 1 ,0], [-1 ...
JavaScript函数节流和函数防抖之间的区别
一.概念解释函数节流和函数防抖,两者都是优化高频率执行js代码的一种手段. 大家大概都知道旧款电视机的工作原理,就是一行行得扫描出色彩到屏幕上,然后组成一张张图片.由于肉眼只能分辨出一定频率的变 ...
numpy用法归纳
1.生成数组 import numpy as np 把python列表转换为数组 >>> np.array([1, 2, 3]) array([1, 2, 3]) 把python的r ...
学习Android过程中的一些博客或工具收集
android studio中使用SlidingMenu: 超简单Android Studio导入第三方库(SlidingMenu)教程绝对傻瓜版 android 更新sdk23以后,报错提示Floa ...
6个常见的php安全攻击
1.SQL注入 SQL注入是一种恶意攻击,用户利用在表单字段输入SQL语句的方式来影响正常的SQL执行.还有一种是通过system()或exec()命令注入的,它具有相同的SQL注入机制,但只针对sh ...

【源码解析】Sharding-Jdbc的执行过程（一）