[转帖]058、集群优化之PD
PD调度基本概念

 
调度流程

 调度中还有这还缺来了merge,例如合并空region。
 store: 基本信息,容量,剩余空间,读写流量等
 region: 范围,副本分布,副本状态,数据量,读写流量等
- 相关调度说明
- balance-leader-scheduler: 保持不同节点的leader均衡
 - balance-region-scheduler: 保持不同节点的Peer均衡
 - hot-region-scheduler: 保持不同节点的读写热点Region均衡
 - evict-leader-{store-id}: 驱逐某个节点的所有leader
 
 
调度limit参数
- 调度当中的生产者相关参数
 
| 参数 | 默认值 | 说明 | 
|---|---|---|
| region-schedule-limit | 2048 | 同时进行Region调度的任务个数 | 
| leader-schedule-limit | 4 | 同时进行leader调度的任务个数 | 
| replica-schedule-limit | 64 | 同时进行replica调度的任务个数 | 
| merge-schedule-limit | 8 | 同时进行region merge调度的任务,设置为0则是关闭这个调度 | 
| hot-region-schedule-limt | 4 | 控制同时进行的hot Region任务。 | 
| patrol-region-interval | 100ms | 控制region的间隔,默认100ms,通常不需要调整 | 
| tolerant-size-ratio | 0 | 控制balance region缓冲区大小,默认是0,表示自动调整,不需要修改 | 
| region_weight leader_weight  | 
1 | PD计算region和leader分数之后,会除以weight得到最终的region和leader分值,weight默认为1,不需要修改 | 
- 调度当中的消费者相关参数-消费限速(store limit)
- 定义: 限制单个store的消费速度
 - 方式: pd-ctl -u ip:port store limit <id> <value>
 - 区别: store limit限制的主要是operator的消费速度,而其他的limit主要是限制operator的产生速度
 
 
存储空间阈值参数

 pd 会为每个TiKV打分(例如leader多的分高),如果分多,则可能将leader允给其他的节点。 但有个前提,如果分少的节点基本没空间了,则分多的节点给它分数就不太合适了。此时通过high-space-ratio: 60% 这个参数控制当节点存储的空间小于这个值的时候,则不考虑这个空间因素了。或者low-space-ratio:80%,当节点存储空间大于这个值的时候,就会优先考虑空间因素了。
常见问题的处理
扩容后balance region 调度速度慢
Grafana PD -> Operator -> Schedule Operator Create
 Grafana PD -> Operator -> Operator Step Duration
 
store节点故障后补副本的速度慢

Region merge速度慢

pd-ctl
- 查看并修改调度参数
 
config show 	-- 显示当前调度相关参数
config set <key> <value>		--	修改相关参数
store limit <store_id> <value>  --限制单个store的调度速度
- 1
 - 2
 - 3
 
- 手动添加Operator
 
operator show [admin|leader|region]	--展示当前全局或某类的调度任务
operator add 	--人工添加一些调度任务实现期望目标,例如
		operator add add-peer <region_id> <store_id>
		operator add remove-peer <region_id> <store_id>
		operator add transfer-leader <region_id> <store_id>
- 1
 - 2
 - 3
 - 4
 - 5
 
- 详细使用方法
 
https://docs.pingcap.com/zh/tidb/v6.5/pd-control
- 1
 
[转帖]058、集群优化之PD的更多相关文章
- HDFS集群优化篇
		
HDFS集群优化篇 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.操作系统级别优化 1>.优化文件系统(推荐使用EXT4和XFS文件系统,相比较而言,更推荐后者,因为XF ...
 - Kafka集群优化篇-调整broker的堆内存(heap)案例实操
		
Kafka集群优化篇-调整broker的堆内存(heap)案例实操 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.查看kafka集群的broker的堆内存使用情况 1>. ...
 - Elasticsearch 集群优化-尽可能全面详细
		
Elasticsearch 集群优化-转载参考1 基本配置 基本配置,5台配置为 24C 125G 17T 的主机,每台主机上搭建了一个elasticsearch节点. 采用的elasticsearc ...
 - 第九章:Elasticsearch集群优化及相关节点配置说明
		
Linux系统调优: Linux调整打开文件数(重新启动生效) 在/etc/security/limits.conf在文件中增加: * soft nofile 8192 * hard nofile 2 ...
 - PaaS容器集群优化之路
		
1. 性能优化面对的挑战 以下是整个PaaS平台的架构 其中主要包括这些子系统: 微服务治理框架:为应用提供自动注册.发现.治理.隔离.调用分析等一系列分布式/微服务治理能力,屏蔽分布式系统的复杂度. ...
 - 大流量大负载的Kafka集群优化实战
		
前言背景 算法优化改版有大需求要上线,在线特征dump数据逐步放量,最终达到现有Kafka集群5倍的流量,预计峰值达到万兆网卡80%左右(集群有几十个节点,网卡峰值流出流量800MB左右/sec.写入 ...
 - spark 集群优化
		
只有满怀自信的人,能在任何地方都怀有自信,沉浸在生活中,并认识自己的意志. 前言 最近公司有一个生产的小集群,专门用于运行spark作业.但是偶尔会因为nn或dn压力过大而导致作业checkpoint ...
 - Java集群优化——dubbo+zookeeper构建高可用分布式集群
		
不久前,我们讨论过Nginx+tomcat组成的集群,这已经是非常灵活的集群技术,但是当我们的系统遇到更大的瓶颈,全部应用的单点服务器已经不能满足我们的需求,这时,我们要考虑另外一种,我们熟悉的内容, ...
 - Java集群优化——使用Dubbo对单一应用服务化改造
		
之前,我们讨论过Nginx+tomcat组成的集群,这已经是非常灵活的集群技术,但是当我们的系统遇到更大的瓶颈,全部应用的单点服务器已经不能满足我们的需求,这时,我们要考虑另外一种,我们熟悉的内容,就 ...
 - [转帖]K8s集群安装--最新版 Kubernetes 1.14.1
		
K8s集群安装--最新版 Kubernetes 1.14.1 http://www.cnblogs.com/jieky/p/10679998.html 原作者写的比较简单 大略流程和跳转的多一些 改天 ...
 
随机推荐
- 还在封装 xxxForm,xxxTable 残害你的同事?试试这个工具
			
之前写过一篇文章 我理想中的低代码开发工具的形态,已经吐槽了各种封装 xxxForm,xxxTable 的行为,这里就不啰嗦了.今天再来看看我的工具达到了什么程度. 多图预警... 以管理后台一个列表 ...
 - Python 潮流周刊第 35 期(摘要)
			
本周刊由 Python猫 出品,精心筛选国内外的 250+ 信息源,为你挑选最值得分享的文章.教程.开源项目.软件工具.播客和视频.热门话题等内容.愿景:帮助所有读者精进 Python 技术,并增长职 ...
 - 2023-06-30:给你一个 rows * cols 大小的矩形披萨和一个整数 k, 矩形包含两种字符: ‘A‘ (表示苹果)和 ‘.‘ (表示空白格子), 你需要切披萨 k-1 次,得到 k 块披
			
2023-06-30:给你一个 rows * cols 大小的矩形披萨和一个整数 k, 矩形包含两种字符: 'A' (表示苹果)和 '.' (表示空白格子), 你需要切披萨 k-1 次,得到 k 块披 ...
 - Cesium渲染一帧中用到的图形技术
			
译者注:本文翻译自Cesium官方博文<Graphics Tech in Cesium - Rendering a Frame>,May 14, 2015 by Patrick Cozzi ...
 - 华为云开天aPaaS 上线,服务千万开发者,使能行业场景化创新
			
摘要:9月25日,华为云在华为全联接2021发布四大生态策略,并宣布2022年投入1亿美元升级沃土云创计划.华为云开天aPaaS正式上线,实现经验即服务,使能行业场景化创新. 本文分享自华为云社区&l ...
 - 火山引擎DataTester:AB实验平台未来演进趋势是怎样的?
			
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 近日,DataFun联合行行AI举办第四届"数据智能创新与实践人工智能大会,火山引擎DataTester ...
 - 用火山引擎DataTester,这家企业开始了“数据驱动增长”
			
年末购物季已至,近些年来,预售抵扣.平台满减.品类专享券.大额补贴--动辄四五种计算方法叠加的大促活动,让不少消费者"懵"感十足.同一样商品,到底谁家卖的最便宜?比价平台应声发展而 ...
 - 24校招,Moka测试开发工程师一面
			
前言 大家好,今天回顾一下楼主当时参加moka测试开发工程师的面试 对其中一些重要问题,我也给出了相应的答案 过程 自我介绍 挑一个项目,详细介绍你在其中担任的职责 如何安排工作的,有什么成果? 回归 ...
 - 阿里云云通信作为 CPaaS 全球代表服务商,上榜 Gartner 报告
			
近日,国际知名研究机构Gartner发布2022年<CPaaS市场指南(Market Guide for Communications Platform as a Service, 2022)& ...
 - Servlet系列:两种创建方式(xml,注解)
			
一.使用web.xml的方式配置(Servlet2.5之前使用) 在早期版本的Java EE中,可以使用XML配置文件来定义Servlet.在web.xml文件中,可以定义Servlet的名称.类名. ...