TiDB Server

1、TiDB总览
- 1.1、TiDB Server架构
- 1.2、TiDB Server 主要功能：
2、SQL语句处理
3、如何将表的数据转成kv形式
4、在线DDL相关模块
5、GC机制与相关模块
6、TiDB Server 缓存
7、热点小表缓存
- 小表缓存原理
- 热点小表缓存-应用

1、TiDB总览

1.1、TiDB Server架构

TiDB Server 是无序的，不存储数据。

(Protocol Layer/Parse/Compile)：负责SQL语句解析和编译(优化)。
(DistSQL/KV/Executor)：执行生成的计划。简单的SQL(例如直接通过主键查到)使用KV,DistSQL复杂SQL执行计划的生成。
(Transaction/KV)：这个和负责事务处理相关的进行。
(PD Client/TiKV Client)：这个负责与PD和TiKV 交互的进程。例如获得时间戳TSO,就是通过PD Client跟PD获取。
(schema load/worker/start job)：这三个进程主要负责online ddl
memBuffer: 缓存当中的数据，类似sga
cache table: 缓存表的内存区域。
GC: 垃圾回收,将MVCC过期版本数据进行回收

1.2、TiDB Server 主要功能：

处理客户端的链接
SQL 语句的解析和编译
关系型数据与 KV 的转化
SQL 语句的执行
Online DDL 的执行（DDL 操作不会阻塞读写，但对整个 TiDB 来说，同一时刻只能有一个 TiDB Server 进行 DDL 操作）
垃圾回收
热点小表缓存
多个 TiDB Server 轮换选举 Owner 节点，Owner 中的 worker 负责执行 DDL
DDL job 会存储在 TiKV 中进行持久化
TiDB 是用 Go 开发的
TiDB Server GC 默认 10 分钟触发一次，删除当前时间上一个 safe point 之前的历史版本数据
热点小表缓存，限制表数据需在 64m 以下，可通过 ALTER TABLE users CACHE; 将 users 表放入 TiDB Server 的 cache table 中。
热点小表缓存如何保证读写一致的问题：tidb_table_cache_lease=5 参数控制缓存租约。5s 之内用户可以从缓存中读取数据；租约到期前，任何用户不能修改此表，租约过期后，写数据直接写入 TiKV，读也是从 TiKV 读，完成写操作之后，缓存重新续约，缓存内容也会刷新。所以当租约到期时，读性能会下降。不支持对缓存表直接做 DDL 操作，需要先关闭。
TiDB 中的表分为两种：聚簇表、非聚簇表。聚簇表需要有主键，非聚簇表可以有主键，也可以没有。KV 转换时，聚簇表使用主键作为 key，非聚簇表不管是否定义了主键，都会生成一个 key。
Protocol Layer 通过 PD Client 异步向 PD 请求 TSO，同时继续进行 SQL 解析和编译，在实际执行前，获取异步请求 TSO 的结果

2、SQL语句处理

**功能：**负责客户端的连接。连上之后把SQL语句发送过来，所以第二件事就是解析这些语句。然后生成一个分布式的执行计划。它是无序的，不保何数据。一个挂掉了，通过一些负载均衡技术，连其它的就可以。

语句的解析和编译

把语句拆分成一个个token，生成一个AST语法树

按照已经解析好了执行计划，把这个执行计划给到executor ,然后它按照plan生成的树状执行计划，执行都时候分两种，

第一种复杂的SQL例如过滤、范围，关联，嵌套等防止跟TiKV耦合度太高，中间抽象出一层DistSQL接口。经过DistSQL 都会变成一个个简单的单表计算任务。
第二种KV ,简单的SQL,POINT CACHE(点查的模块),例如根据主键或者唯一索引，查看一行或0行记录这种。

SQL层

SQL 层，对外暴露 MySQL 协议的连接 endpoint，负责接受客户端的连接，执⾏SQL 解析和优化，最终⽣成分布式执⾏计划。TiDB 层本身是⽆状态的，实践中可以启动多个 TiDB 实例，通过负载均衡组件（如 LVS、HAProxy 或 F5）对外提供统⼀的接⼊地址，客户端的连接可以均匀地分摊在多个 TiDB 实例上以达到负载均衡的效果。TiDB Server 本身并不存储数据，只是解析 SQL，将实际的数据读取请求转发给底层的存储节点 TiKV（或 TiFlash）。

协议层

protocol layer :协议层，能够让tidb在网络层中提供服务，例如mysql 协议的服务，通过之后，然后客户端连上tidb，把SQL语法发过来

上下文

session context: 会话上下文。例如存放用户登录的数据。登录成功后，SQL语句就发送给解析层

解析层

parser: 解析层，当然这个SQL肯定还是要前往到具体到某台TiKV server上，集群当中的某一个leader上。所以它要去到哪个leader上面呢，它会去问pd(大脑)，要对应的 data location,找到某个tikv server的地址；另外还有个功能就是将SQL语句变成树形结构，这个树形结构当中会保存这条SQL语句要访问的对象以及对这个对象的操作。

逻辑优化器

logical optimizer : 逻辑优化器，
统计信息：通过一系列规则，例如总行数等辅助信息。这些辅助信息有可能对这个SQL语句的执行起到帮助的作用

物理优化器

physical optimier: 物理优化器，拿到这些统计信息再结合逻辑优化器生成的执行计划。来生成一个更好的物理执行计划。这个执行计划会交由两个执行器来处理，

本地执行器

local executor: 如果我有一些命令，需要在客户端所连的那一台TiDB Server上操作，那这个时候就会本地执行器来做

分布式执行器

Distributed Executor: 这个SQL，是需要去到TiKV上操作命令的执行，则这些SQL 会交给分布式执行器来处理。为什么是分布式的，因为TiKV server实际是一个集群，上面执行的SQL是一个并行SQL,它会在多台TiKV server上同时执行这样的SQL

3、如何将表的数据转成kv形式

4、在线DDL相关模块

5、GC机制与相关模块

用于回收mvcc 旧版本，定期清理。这个动作就叫gc
例如可以设置一个gc lift time = 4hout 则safe point 为4个小时，则四个小时内的数据即使增删改，也可以找到这四小当中的任意数据

6、TiDB Server 缓存

TiDB Server缓存组成
- SQL结果
- 线程缓存
- 元数据，统计信息
TiDB Server缓存管理
- tidb_mem_quota_query
- oom-action

语句执行过程中，需要的数据会先放到缓存中，这个很类似pga
tidb_meme_quota_query: 限制每条SQL使用的内存，占用缓存的大小
oom-action: 当超过tidb_meme_quota_query这个值后，是如何执行这条SQL(例如中断或者忽略)

7、热点小表缓存

表的数据量不大
只读表或者修改不频繁的表
表的访问和频繁

小表缓存原理

这张表的大小要小于64M才能放到cache
tidb_table_cache_lease: 租约，类似租房的有效期。

热点小表缓存-应用

TiDB对于每张缓存表的大小限制为64Mb
适用于查询频繁、数据量不大、极少修改的场景
在租约（tidb_table_cache_lease）时间内，写操作会被阻塞
当租约到期（tidb_table_cache_lease）时，读性能会下降
不支持对缓存表直接做DDL，需要先关闭
对于表加载较慢或者极少修改的表，可以适当延长tidb_table_cache_lease 保持读性能稳定

文章知识点与官方知识档案匹配，可进一步学习相关知识

Java技能树首页概览129010 人正在系统学习中

[转帖]002、体系结构之TiDB Server的更多相关文章

如何在没有代理的情况下编译 tidb server
这里主要介绍 tidb server 的编译, ti kv 和 ti pd 的编译不在本文范围内: go 语言 1.11 版本之后支持 go.mod, 依赖包在 go.mod 里生成, 如果 go. ...
[转帖]linux下的X server:linux图形界面原理
linux下的X server:linux图形界面原理 https://www.cnblogs.com/liangxiaofeng/p/5034912.html linux下的X server:lin ...
[转帖]Kerberos和NTLM - SQL Server
Kerberos和NTLM - SQL Server https://www.cnblogs.com/dreamer-fish/p/3458425.html 当我们使用Windows Authenti ...
SQL 数据库学习 002 如何启动 SQL Server 软件
如何启动 SQL Server 软件我的电脑系统: Windows 10 64位使用的SQL Server软件: SQL Server 2014 Express 如果你还没有下载 SQL Serv ...
重建索引提高SQL Server性能
大多数SQL Server表需要索引来提高数据的访问速度,如果没有索引,SQL Server 要进行表格扫描读取表中的每一个记录才能找到索要的数据.索引可以分为簇索引和非簇索引,簇索引通过重排表中的数 ...
DBCC DBREINDEX重建索引提高SQL Server性能
大多数SQL Server表需要索引来提高数据的访问速度,如果没有索引,SQL Server 要进行表格扫描读取表中的每一个记录才能找到索要的数据.索引可以分为簇索引和非簇索引,簇索引通过重排表中的数 ...
ORACLE数据库学习之体系结构
Oracle体系结构 ORACLE数据库体系结构决定了oracle如何使用网络.磁盘和内存.包括实例(instance),文件(file)和进程(process不包括后台进程)三部分. 实例:每 ...
TiDB show processlist命令源码分析
背景因为丰巢自去年年底开始在推送平台上尝试了TiDB,最近又要将承接丰巢所有交易的支付平台切到TiDB上.我本人一直没有抽出时间对TiDB的源码进行学习,最近准备开始一系列的学习和分享.由于我本人没 ...
浅谈SQL Server内部运行机制
对于已经很熟悉T-SQL的读者,或者对于较专业的DBA来说,逻辑的增删改查,或者较复杂的SQL语句,都是非常简单的,不存在任何挑战,不值得一提,那么,SQL的哪些方面是他们的挑战或者软肋呢? 那就是 ...
TiDB 架构及设计实现
一. TiDB的核心特性高度兼容 MySQL 大多数情况下,无需修改代码即可从 MySQL 轻松迁移至 TiDB,分库分表后的 MySQL 集群亦可通过 TiDB 工具进行实时迁移. 水平弹性扩展 ...

随机推荐

文心一言 VS 讯飞星火 VS chatgpt （173）-- 算法导论13.3 2题
二.用go语言,将关键字41.38.31.12.19.8连续地插入一棵初始为空的红黑树之后,试画出该结果树. 文心一言: 首先,我们需要了解红黑树的性质.红黑树是一种自平衡二叉查找树,其中每个节点要么 ...
解决 cv2.destroyAllWindows() 无效问题
方法一示例代码: import cv2 import numpy as npimg = np.zeros((512,512),np.uint8)#生成一个空灰度图像 cv2.line(img,(0, ...
Programming abstractions in C阅读笔记：p181-p183
<Programming Abstractions In C>学习第61天,p181-p183总结. 一.技术总结 1.linear search algorithm 2.lexicogr ...
python -m http.server在本地启动简单HTTP服务器的命令
1.python -m http.server 命令 python -m http.server 是一个用于在本地启动简单 HTTP 服务器的命令.这个命令会在当前工作目录启动一个基本的 HTTP ...
Cassandra Gossip协议的二三事儿
摘要:Gossip协议是Cassandra维护各节点状态的一个重要组件,下面我们以Gossip协议三次握手为线索逐步分析Gossip协议源码. Gossip协议是Cassandra维护各节点状态的一个 ...
解析Stream foreach源码
摘要:串行流比较简单,对于parallelStream,站在它背后的是ForkJoin框架. 本文分享自华为云社区<深入理解Stream之foreach源码解析>,作者:李哥技术 . 前言 ...
边缘AI研发落地生态挑战调研报告发布
摘要:随着边缘设备的广泛使用和性能提升,将机器学习相关的部分任务迁移到边缘,也即边缘AI技术,已成为必然趋势.但仅凭技术是不足够完成落地和产业转化的.近日我们启动了边缘AI研发落地生态挑战调研.我们发 ...
总结vue3 的一些知识点：MySQL NULL 值处理
MySQL NULL 值处理我们已经知道 MySQL 使用 SQL SELECT 命令及 WHERE 子句来读取数据表中的数据,但是当提供的查询条件字段为 NULL 时,该命令可能就无法正常工作. ...
火山引擎ByteHouse：4000字总结，Serverless在OLAP领域应用的五点思考
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群作为云计算的下一个迭代,Serverless可以使开发者更专注于构建产品中的应用,而无需考虑底层堆栈问题.伴随着近 ...
PPT 动态迷幻图谱
迷幻动画的本质拆解插件: islide + 软件: PowerPoint https://www.islide.cc/ 圆型画一个正圆,无填充色,边框 2.25磅左边红色.右边黄色.中间两个透明 ...

[转帖]002、体系结构之TiDB Server