腾讯云数据库团队：PostgreSQL TOAST技术理解

作者介绍：胡彬腾讯云高级工程师

TOAST是“The Oversized-Attribute Storage Technique”的缩写，主要用于存储一个大字段的值。要理解TOAST，我们要先理解页（BLOCK）的概念。在PG中，页是数据在文件存储中的基本单位，其大小是固定的且只能在编译期指定，之后无法修改，默认的大小为8KB。同时，PG不允许一行数据跨页存储，那么对于超长的行数据，PG就会启动TOAST，具体就是采用压缩和切片的方式。如果启用了切片，实际数据存储在另一张系统表的多个行中，这张表就叫TOAST表，这种存储方式叫行外存储。

在深入细节之前，我们要先了解，在PG中每个表字段有四种TOAST的策略：

PLAIN：避免压缩和行外存储。只有那些不需要TOAST策略就能存放的数据类型允许选择（例如int类型），而对于text这类要求存储长度超过页大小的类型，是不允许采用此策略的
EXTENDED：允许压缩和行外存储。一般会先压缩，如果还是太大，就会行外存储
EXTERNA：允许行外存储，但不许压缩。类似字符串这种会对数据的一部分进行操作的字段，采用此策略可能获得更高的性能，因为不需要读取出整行数据再解压。
MAIN：允许压缩，但不许行外存储。不过实际上，为了保证过大数据的存储，行外存储在其它方式（例如压缩）都无法满足需求的情况下，作为最后手段还是会被启动。因此理解为：尽量不使用行外存储更贴切。现在我们通过实际操作来研究TOAST的细节：

首先创建一张blog表：

postgres=# create table blog(id int, title text, content text);

CREATE TABLE

postgres=# \d+ blog;

                          Table "public.blog"

 Column  |  Type   | Modifiers | Storage  | Stats target | Description

---------+---------+-----------+----------+--------------+-------------

 id      | integer |           | plain    |              |

 title   | text    |           | extended |              |

 content | text    |           | extended |              |

可以看到，interger默认TOAST策略为plain，而text为extended。PG资料告诉我们，如果表中有字段需要TOAST，那么系统会自动创建一张TOAST表负责行外存储，那么这张表在哪里？

postgres=# select relname,relfilenode,reltoastrelid from pg_class where relname='blog';

 relname | relfilenode | reltoastrelid

---------+-------------+---------------

 blog    |       16441 |         16444

(1 row)

通过上诉语句，我们查到blog表的oid为16441，其对应TOAST表的oid为16444（关于oid和pg_class的概念，请参考PG官方文档），那么其对应TOAST表名则为：pg_toast.pg_toast_16441（注意这里是blog表的oid），我们看下其定义：

postgres=# \d+ pg_toast.pg_toast_16441;

TOAST table "pg_toast.pg_toast_16441"

   Column   |  Type   | Storage

------------+---------+---------

 chunk_id   | oid     | plain

 chunk_seq  | integer | plain

 chunk_data | bytea   | plain

TOAST表有3个字段：

chunk_id：用来表示特定TOAST值的OID，可以理解为具有同样chunk_id值的所有行组成原表（这里的blog）的TOAST字段的一行数据
chunk_seq：用来表示该行数据在整个数据中的位置
chunk_data：实际存储的数据。现在我们来实际验证下:

postgres=# insert into blog values(1, 'title', '0123456789');

INSERT 0 1

postgres=# select * from blog;

 id | title |  content

----+-------+------------

  1 | title | 0123456789

(1 row)

postgres=# select * from pg_toast.pg_toast_16441;

 chunk_id | chunk_seq | chunk_data

----------+-----------+------------

(0 rows)

可以看到因为content只有10个字符，所以没有压缩，也没有行外存储。然后我们使用如下SQL语句增加content的长度，每次增长1倍，同时观察content的长度，看看会发生什么情况？

postgres=# update blog set content=content||content where id=1;

UPDATE 1

postgres=# select id,title,length(content) from blog;

 id | title | length

----+-------+--------

  1 | title |     20

(1 row)

postgres=# select * from pg_toast.pg_toast_16441;

 chunk_id | chunk_seq | chunk_data

----------+-----------+------------

(0 rows)

反复执行如上过程，直到pg_toast_16441表中有数据：

postgres=# select id,title,length(content) from blog;

 id | title | length

----+-------+--------

  1 | title | 327680

(1 row)

postgres=# select chunk_id,chunk_seq,length(chunk_data) from pg_toast.pg_toast_16441;

 chunk_id | chunk_seq | length

----------+-----------+--------

    16439 |         0 |   1996

    16439 |         1 |   1773

(2 rows)

可以看到，直到content的长度为327680时（已远远超过页大小8K），对应TOAST表中才有了2行数据，且长度都是略小于2K，这是因为extended策略下，先启用了压缩，然后才使用行外存储

下面我们将content的TOAST策略改为EXTERNA，以禁止压缩。

postgres=# alter table blog alter content set storage external;

ALTER TABLE

postgres=# \d+ blog;

                          Table "public.blog"

 Column  |  Type   | Modifiers | Storage  | Stats target | Description

---------+---------+-----------+----------+--------------+-------------

 id      | integer |           | plain    |              |

 title   | text    |           | extended |              |

 content | text    |           | external |              |

然后我们再插入一条数据：

postgres=# insert into blog values(2, 'title', '0123456789');

INSERT 0 1

postgres=# select id,title,length(content) from blog;

 id | title | length

----+-------+--------

  1 | title | 327680

  2 | title |     10

(2 rows)

然后重复以上步骤，直到TOAST表中产生新的行：

postgres=# update blog set content=content||content where id=2;

UPDATE 1

postgres=# select id,title,length(content) from blog;

 id | title | length

----+-------+--------

  2 | title |   2560

  1 | title | 327680

(2 rows)

postgres=# select chunk_id,chunk_seq,length(chunk_data) from pg_toast.pg_toast_16441;

 chunk_id | chunk_seq | length

----------+-----------+--------

    16447 |         0 |   1996

    16447 |         1 |   1773

    16448 |         0 |   1996

    16448 |         1 |    564

(4 rows)

这次我们看到当content长度达到2560（按照官方文档，应该是超过2KB左右），TOAST表中产生了新的2条chunk_id为16448的行，且2行数据的chunk_data的长度之和正好等于2560。通过以上操作得出以下结论：

如果策略允许压缩，则TOAST优先选择压缩
不管是否压缩，一旦数据超过2KB左右，就会启用行外存储
修改TOAST策略，不会影响现有数据的存储方式

腾讯云数据库团队：PostgreSQL TOAST技术理解的更多相关文章

腾讯云数据库团队：浅谈如何对MySQL内核进行深度优化
作者介绍:简怀兵,腾讯云数据库团队高级工程师,负责腾讯云CDB内核及基础设施建设:先后供职于Thomson Reuters和YY等公司,PTimeDB作者,曾获一项发明专利:从事MySQL内核开发工作 ...
腾讯云数据库团队：MySQL AHI 实现解析
MySQL 定位用户记录的过程可以描述为:打开索引 -> 根据索引键值逐层查找 B+ 树 branch 结点 -> 定位到叶子结点,将 cursor 定位到满足条件的 rec 上:如果树高 ...
腾讯云数据库团队：MySQL数据库的高可用性分析
作者介绍:易固武,腾讯高级工程师,参与腾讯账号安全建设,腾讯数据仓库(TDW)优化改造,腾讯云数据库等项目,对大规模分布式存储和计算系统有浓厚的兴趣和经历 MySQL数据库是目前开源应用最大的关系型数 ...
腾讯云数据库团队：phpMyAdmin中sql-parser组件的使用
phpMyAdmin是一款基于Web端运行的开源数据库管理工具,支持管理MySQL和MariaDB两种数据库. phpMyAdmin的程序主要使用php和javascript开发,它的安装使用都比较简 ...
腾讯云数据库团队：SQL Server 数据加密功能解析
数据加密是数据库被破解.物理介质被盗.备份被窃取的最后一道防线:数据加密,一方面解决数据被窃取安全问题,另一方面有关法律要求强制加密数据:SQL Server 的数据加密相较于其他数据库,功能相对完善 ...
腾讯云数据库团队：MySQL语句复制（SBR）的缺陷列举
作者介绍: 赵伟腾讯云TDSQL数据库开发者 MySQL (这里的MySQL是指广义的mysql,包括oracle,mysql,percona,mariadb等)的Statement Based R ...
腾讯云数据库团队：MySQL5.7 JSON实现简单介绍
作者介绍:吴双桥腾讯云project师阅读原文.很多其它技术干货.请訪问fromSource=gwzcw.57435.57435.57435">腾云阁. 本文主要介绍在MySQL ...
MySQL之父造访腾讯云为腾讯云数据库开源点赞
近日,技术大牛 MariaDB 公司创始人兼CTO Michael Widenius(又名Monty).MariaDB 基金会主席 Kaj 来到中国,针对MariaDB与腾讯云的技术合作进行回访.去年 ...
TDSQL｜三篇论文入选国际顶会SIGMOD，厉害了腾讯云数据库
好消息!6月13日,腾讯云数据库三篇论文再次入选数据库行业顶会SIGMOD,被SIGMOD 2022 Research Full Paper(研究类长文)收录. 本次被收录的研究成果中,新型数据结构设 ...

随机推荐

关于github中的README.md文件
0x01 README.md文件是用Markdown语言编写的,md=Markdown; 在线编辑工具: https://stackedit.io/editor# https://maxiang.io ...
Azure机器学习入门（四）模型发布为Web服务
接Azure机器学习(三)创建Azure机器学习实验,下一步便是真正地将Azure机器学习的预测模型发布为Web服务.要启用Web服务发布任务,首先点击底端导航栏的运行即"Run" ...
[Hadoop] - Win7下提交job到集群上去
一般我们采用win开发+linux hadoop集群的方式进行开发,使用插件:hadoop-***-eclipse-plugin. 运行程序的时候,我们一般采用run as application或者 ...
4105: [Thu Summer Camp 2015]平方运算
首先嘛这道题目只要知道一个东西就很容易了:所有循环的最小公约数<=60,成一条链的长度最大为11,那么我们就可以用一个很裸的方法.对于在链上的数,我们修改直接暴力找出并修改.对于在环上的数,我们 ...
Java自动装箱和拆箱
jdk5.0之后,在基本数据类型封装类之间增加了自动装箱和拆箱的功能,其实“自动”的实现很简单,只是将装箱和拆箱通过编译器,进行了“自动补全”,省去了开发者的手动操作. 而进行封装类与对应基本数据类型 ...
[转]支持向量机SVM总结
首先,对于支持向量机(SVM)的简单总结: 1. Maximum Margin Classifier 2. Lagrange Duality 3. Support Vector 4. Kernel 5 ...
EFcore与动态模型（三）
紧接着上面的内容,我们继续看下动态模型页面交互实现方式,内容如下: 1,如何实现动态表单 2,如何接收表单数据并绑定到动态模型上一.如何实现动态表单由于模型信息都是后台自定义配置的,并不是固定不变 ...
Android 反射-换一种方式编程
Android 反射-换一种方式编程转载请标明出处:http://blog.csdn.net/zhaoyanjun6/article/details/59109933 本文出自[赵彦军的博客] 上一 ...
linux系统端口查看和占用的解决方案
使用netstat命令查看端口占用情况 netstat -tln 查看什么程序占用端口 netstat -tlnp 过滤端口 netstat -tlnp |grep 8080 杀掉进程 kill - ...
规范 : 过程 : login cookies sessionTimeOut
规范用户登入网站将得到一个cookies,如果用户有2个account,各别登入admin page 和 client page,是会得到2个cookies. 在reload page时,后台会得到 ...

腾讯云数据库团队：PostgreSQL TOAST技术理解

相关阅读：

腾讯云数据库团队：PostgreSQL TOAST技术理解的更多相关文章

随机推荐

热门专题