首先为大家推荐这个 OceanBase 开源负责人老纪的公众号 “老纪的技术唠嗑局”,会持续更新和 OceanBase 相关的各种技术内容。欢迎感兴趣的朋友们关注!

定场诗《回家的路》

从公司回家时,

每次都会路过丽水路。

这条路上植被很多,

旁边就是京杭大运河。

可惜路又长又窄,

长四公里,窄到机动车道和非机动车道被合二为一。

回家路上经常看到这样的景象,

几辆自行车骑上了这条说不清是机动车道还是非机动车道的路,

后面的汽车怕撞到自行车,

只能一路陪着骑车的人慢悠悠地开。

背景

大家先思考这样一个问题:在一条机动车道和非机动车道被合二为一的道路上,单位时间内,大家会选择让十辆汽车通过,还是选择让一辆自行车和一辆汽车通过?我个人觉得,让它更快速地通过大量汽车,才能让这条路发挥出更大的作用。

在 AP、TP 业务混布的场景下,因为 CPU 资源有限,OceanBase 认为,让 CPU 尽量先服务更大量的 TP 小请求更有意义

大查询的判定时机

如果要抓出大查询,就需要判定一条 SQL 是否属于大查询。

OceanBase 中有一个集群级的配置项叫做 large_query_threshold,默认值是 5 秒。

第一次执行 Query 时,因为无法提前预估 Query 的执行时间,所以默认不是大查询(这里其实还是有一些改进空间的)。

如果不是第一次执行这条 Query,因为 Plan Cache 中已经缓存了这条 Query 的计划,所以会根据 Plan Cache 中缓存的之前这条 Query 的平均执行时间,来判定是否属于大查询。

大查询的限制策略

如果 Query 被判定为大查询,则会被直接丢到大查询队列重试,让出当前工作线程。

大查询有单独的线程组调度执行,该线程组与普通工作线程组对等。相当于数据库系统自动会为大查询开辟了一条 “非机动车道”。

大查询队列中的 Query,会受配置项 large_query_worker_percentage(默认值 30%)控制。效果类似于为大查询被单独开了一个资源组,这个资源组内被限制只能使用 30% 的 CPU 资源进行计算。

限流技巧分享

如果突然出现多个第一次执行的大查询,普通工作线程都被占用了怎么办?

缓解方式是:kill 数据库的 session,重连即可恢复。

因为 kill session 之后,Plan Cache 依然会缓存没执行完的 Query 的计划和记录曾经的执行时间。重连 session 之后,大查询就会在编译期通过大查询预判,进入大查询队列,不再占用普通工作线程。

PX 线程怎么限制资源占用?

PX 线程(并行执行工作线程)有独立的线程组,不会受到大查询的限制。大查询队列只会影响普通工作线程组。

这里有一点需要说明:当没有小查询的时候,大查询可以占用全部普通工作线程组的资源。只有当同时有大查询和小查询时,默认 30% 的比例才生效。

因为并行执行本就不应该通过大查询队列来进行限制:一边要用更多资源让 Query 并行执行,跑的更快,一边又要限制不能用更多资源。PX 线程如果要进行资源限制和隔离,还是需要用到上周提到的资源组(resource group)

SQL 限流功能

最后顺带介绍 OceanBase 中几个和 SQL 限流相关的功能。

使用文本限流

如果要限制某类 SQL 请求执行流量,可以通过创建 outline,添加 /*+max_concurrent(N)*/ 这个 hint,N 表示某类 Query 同时可执行的请求数(实际内部限制的是某类 Plan 同时执行的请求个数)。

语法:

CREATE [OR REPLACE]
OUTLINE outline_name
ON stmt [TO target_stmt];

举例:

create table t1(c1 int, c2 int);

-- ? 表示通配符,限制这类请求个数最多为 0
create outline ol_1 on
select /*+max_concurrent(0)*/ *
from t1
where c1 = 1 and c2 = ?; -- 执行失败
select *
from t1
where c1 = 1 and c2 = 0;
ERROR 5268 (HY000): SQL reach max concurrent num 0 -- 执行失败
select *
from t1
where c1 = 1 and c2 = 1;
ERROR 5268 (HY000): SQL reach max concurrent num 0 -- 执行成功
select *
from t1
where c1 = 12345 and c2 = 2;
Empty set (0.01 sec)

模糊限流

语法:

CREATE [OR REPLACE]
FORMAT OUTLINE outline_name
ON format_stmt [TO format_target_stmt]

其中 format_stmt 表示归一化后的 SQL,归一化规则如下:

  • 归一化常量参数
  • 归一化为大写
  • 忽略空格、换行符等非语法定义符号差异
  • 对于in表达式,将会做归一化
obclient>
select
statement_digest_text(
'select * from
t1 where c1 in (1, 2) and c2 = 3'
);
result : SELECT * FROM T1 WHERE C1 IN (...) AND C2 = ?
1 row in set (0.00 sec)

举例:

-- 创建 format outline
create format outline fmt_otl
on
select /*+max_concurrent(0)*/ *
from t1
where c1 in (?, ?) and c2 = ?; -- 执行失败
select *
from t1
where c1 in (1)
and c2 = 2;
ERROR 5268 (HY000): SQL reach max concurrent num 0 -- 执行失败
select *
from t1
where c1 in (1, 2)
and c2 = 3;
ERROR 5268 (HY000): SQL reach max concurrent num 0 -- 执行失败
select *
from t1
where c1 in (1, 2, 3)
and c2 = 4;
ERROR 5268 (HY000): SQL reach max concurrent num 0

老纪的技术唠嗑局 不仅希望能持续给大家带来有价值的技术分享,也希望能和大家一起为开源社区贡献力量。如果你对 OceanBase 开源社区认可,点亮一颗小星星 吧!你的每一个Star,都是我们努力的动力~

https://github.com/oceanbase/oceanbase

OceanBase 中的非机动车道 —— SQL 限流技巧分享的更多相关文章

  1. 【Distributed】限流技巧

    一.概述 1.1 高并发服务限流特技 1.2 为什么要互联网项目要限流 1.3 高并发限流解决方案 二.限流算法 2.1 计数器 2.2 滑动窗口计数 2.3 令牌桶算法 使用RateLimiter实 ...

  2. ASP.NET Core中使用固定窗口限流

    算法原理 固定窗口算法又称计数器算法,是一种简单的限流算法.在单位时间内设定一个阈值和一个计数值,每收到一个请求则计数值加一,如果计数值超过阈值则触发限流,如果达不到则请求正常处理,进入下一个单位时间 ...

  3. ASP.NET Core中使用滑动窗口限流

    滑动窗口算法用于应对请求在时间周期中分布不均匀的情况,能够更精确的应对流量变化,比较著名的应用场景就是TCP协议的流量控制,不过今天要说的是服务限流场景中的应用. 算法原理 这里假设业务需要每秒钟限流 ...

  4. ASP.NET Core中使用令牌桶限流

    在限流时一般会限制每秒或每分钟的请求数,简单点一般会采用计数器算法,这种算法实现相对简单,也很高效,但是无法应对瞬时的突发流量. 比如限流每秒100次请求,绝大多数的时间里都不会超过这个数,但是偶尔某 ...

  5. 令牌桶限流思路分享(PHP+Redis实现机制)

    一 .场景描述 在开发接口服务器的过程中,为了防止客户端对于接口的滥用,保护服务器的资源, 通常来说我们会对于服务器上的各种接口进行调用次数的限制.比如对于某个 用户,他在一个时间段(interval ...

  6. javascript中关于&& 和 || 表达式的小技巧分享

    如果你还是新手, 而且读完所有这些技巧的详解和每种技巧是如果工作的以后运用它们, 你会写出更加简练高效的JavaScript程序. 确实, JavaScript高手已经运用这些技巧写出了很多强大, 高 ...

  7. Redis解读(4):Redis中HyperLongLog、布隆过滤器、限流、Geo、及Scan等进阶应用

    Redis中的HyperLogLog 一般我们评估一个网站的访问量,有几个主要的参数: pv,Page View,网页的浏览量 uv,User View,访问的用户 一般来说,pv 或者 uv 的统计 ...

  8. ASP.NET Core中使用漏桶算法限流

    漏桶算法是限流的四大主流算法之一,其应用场景各种资料中介绍的不多,一般都是说应用在网络流量控制中.这里举两个例子: 1.目前家庭上网都会限制一个固定的带宽,比如100M.200M等,一栋楼有很多的用户 ...

  9. 限流&熔断的考量

    限流的原则,是尽量在流量源头限,并且是需要依据现有团队所掌握的技能来. 如上最左侧便是主要流量的来源入口,首先就要限制的地方就是slb节点的income流量 slb节点的流量特点是啥?加限流怎么加?限 ...

  10. 基于令牌桶算法实现的SpringBoot分布式无锁限流插件

    本文档不会是最新的,最新的请看Github! 1.简介 基于令牌桶算法和漏桶算法实现的纳秒级分布式无锁限流插件,完美嵌入SpringBoot.SpringCloud应用,支持接口限流.方法限流.系统限 ...

随机推荐

  1. 工作面试必备:SQL 中的各种连接 JOIN 的区别总结!

    前言 尽管大多数开发者在日常工作中经常用到Join操作,如Inner Join.Left Join.Right Join等,但在面对特定查询需求时,选择哪种Join类型以及如何使用On和Where子句 ...

  2. 人工智能-A*算法-最优路径搜索实验

    上次学会了<A*算法-八数码问题>,初步了解了A*算法的原理,本次再用A*算法完成一个最优路径搜索实验. 一.实验内容1. 设计自己的启发式函数.2. 在网格地图中,设计部分障碍物.3. ...

  3. Netty基础—8.Netty实现私有协议栈

    大纲 1.私有协议介绍 2.私有协议的通信模型 3.私有协议栈的消息定义 4.私有协议栈链路的建立 5.私有协议栈链路的关闭 6.私有协议栈的心跳机制 7.私有协议栈的重连机制 8.私有协议栈的重复登 ...

  4. C++基础学习--随记

    博客地址:https://www.cnblogs.com/zylyehuo/ 参考"C++基础与深度解析" 一.预备知识 // c++常用工具 /usr/bin/time //查看 ...

  5. 搭建docker swarm集群实现负载均衡

    Swarm简介:Swarm是Docker官方提供的一款集群管理工具,其主要作用是把若干台Docker主机抽象为一个整体,并且通过一个入口统一管理这些Docker主机上的各种Docker资源.Swarm ...

  6. Linux中查看进程状态信息

    一.常用命令总结  ps -l   列出与本次登录有关的进程信息:    ps -aux   查询内存中进程信息:    ps -aux | grep ***   查询***进程的详细信息:    t ...

  7. DVWA靶场实战(十三)——CSP Bypass

    DVWA靶场实战(十三) 十三.CSP Bypass: 1.漏洞原理: CSP Bypass全称是Content-Security-Policy,中文叫做绕过内容安全策略.Content-Securi ...

  8. 匿名内部类、lambda匿名函数表达式

    a.匿名内部类的定义格式: 接口名称 对象名 = new 接口名称(){ //覆盖重写所有抽象方法 }: 一. /** * lambda匿名函数的使用 * Lambda省去面向对象的条条框框,格式由3 ...

  9. Ubuntu v22配置用户临界值

    方法 1:使用 pam_faillock(推荐,Ubuntu 22.04 默认方式) pam_faillock 是较新的 PAM 模块,用于记录失败登录尝试并在达到限制后锁定账户. 修改 /etc/p ...

  10. Traefik,想说爱你不容易:一场动态反向代理的心累之旅

    前言:技术选型的初心 在微服务盛行.容器部署逐渐常态化的今天,"动态反向代理"显得尤为重要. Traefik 凭借其原生支持 Docker.自动生成路由.集成 Let's Encr ...