KingbaseES V8R3集群维护案例之---pcp_node

案例说明：

在一次KingbaseES V8R3集群切换分析中，运维人员执行了pcp_node_refresh，导致集群发生了failover的切换。此文档对pcp_node_refresh工具做了应用说明及测试，不建议在生产环境使用此工具。

适用版本：

KingbaseES V8R3

一、pcp_node_refresh应用说明

1.  pcp_node_refresh 必须要指定节点ID（就是show pool_nodes中查出来的id），刷新这个节点的状态。动作是将数据库踢出集群，然后再加入进来。

2.  pcp_node_refresh 指向主库，将主库踢出集群，这个时候会认为主库故障触发会切换  ----------- 集群failover切换。

3.  pcp_node_refresh 指向备库，将备库踢出集群再加入，集群无影响。

二、测试案例

1、集群节点状态

TEST=# show pool_nodes;

 node_id |   hostname    | port  | status | lb_weight |  role   | select_cnt | load_balance_node | replication_delay

---------+---------------+-------+--------+-----------+---------+------------+-------------------+-------------------

 0       | 192.168.1.101 | 54321 | up     | 0.500000  | primary | 0          | true              | 0

 1       | 192.168.1.102 | 54321 | down   | 0.500000  | standby | 0          | false             | 0

(2 rows)

---如上所示，备库节点状态是down，执行pcp_node_refresh刷新节点。

2、执行pcp_node_refresh刷新备库节点

1）执行pcp_node_refresh

# 执行pcp_node_refresh

[kingbase@node101 bin]$ ./pcp_node_refresh -U kingbase -h 192.168.1.101 1

Password:

pcp_node_refresh -- Command Successful

# 查看节点状态

[kingbase@node101 bin]$ ./ksql -U SYSTEM -W 123456 TEST -p 9999

ksql (V008R003C002B0290)

Type "help" for help.

TEST=# show pool_nodes;

 node_id |   hostname    | port  | status | lb_weight |  role   | select_cnt | load_balance_node | replication_delay

---------+---------------+-------+--------+-----------+---------+------------+-------------------+-------------------

 0       | 192.168.1.101 | 54321 | up     | 0.500000  | primary | 0          | false             | 0

 1       | 192.168.1.102 | 54321 | up     | 0.500000  | standby | 0          | true              | 0

(2 rows)

TEST=# select * from sys_stat_replication;

  PID  | USESYSID | USENAME | APPLICATION_NAME |  CLIENT_ADDR  | CLIENT_HOSTNAME | CLIENT_PORT |         BACKEND_START         | B

ACKEND_XMIN |   STATE   | SENT_LOCATION | WRITE_LOCATION | FLUSH_LOCATION | REPLAY_LOCATION | SYNC_PRIORITY | SYNC_STATE

-------+----------+---------+------------------+---------------+-----------------+-------------+-------------------------------+--

------------+-----------+---------------+----------------+----------------+-----------------+---------------+------------

 28587 |       10 | SYSTEM  | node101          | 192.168.1.102 |                 |       47629 | 2022-09-05 13:42:43.870560+08 |

            | streaming | 1/E92607D0    | 1/E92607D0     | 1/E92607D0     | 1/E9260780      |             0 | async

(1 row)

---如上所示，备库节点状态恢复正常。

2）查看日志信息

如下cluster.log所示：执行pcp_node_refresh后，对备库节点作为故障节点进行了recovery的恢复。

如下recovery.log所示，执行pcp_node_refresh后，对备库节点调用sys_rewind恢复备库节点。

3、执行pcp_node_refresh刷新主库节点

1）执行pcp_node_refresh

[kingbase@node101 bin]$ ./pcp_node_refresh -U kingbase -h 192.168.1.101 0

Password:

pcp_node_refresh -- Command Successful

TEST=# show pool_nodes;

 node_id |   hostname    | port  | status | lb_weight |  role   | select_cnt | load_balance_node | replication_delay

---------+---------------+-------+--------+-----------+---------+------------+-------------------+-------------------

 0       | 192.168.1.101 | 54321 | up     | 0.500000  | standby | 0          | true              | 0

 1       | 192.168.1.102 | 54321 | up     | 0.500000  | primary | 0          | false             | 0

(2 rows)

---如上所示，主备节点发生了切换。

2）查看日志信息

如下cluster.log所示：执行pcp_node_refresh后，对主库节点作为故障调用failover_stream.sh执行了failover切换。

如下failover.log所示：执行pcp_node_refresh后，failover切换过程。

-----------------2022-09-05 13:45:42 failover beging---------------------------------------

----failover-stats is %H = hostname of the new master node [192.168.1.102], %P = old primary node id [1], %d = node id[0], %h = host name [192.168.1.101], %O = old primary host[192.168.1.102] %m = new master node id [1], %M = old master node id [1], %D = database cluster path [/home/kingbase/cluster/R3HA/db/data].

----ping trust ip

ping trust ip 192.168.1.1 success

----determine whether the faulty db is master or standby

standby down, master still 192.168.1.102

The sys_stat_replication view result is : []

2022-09-05 13:45:44 sync to async

ALTER SYSTEM

 SYS_RELOAD_CONF

-----------------

 t

(1 row)

-----------------2022-09-05 13:45:44 failover end---------------------------------------

三、总结

pcp_node_refresh不建议在生产环境使用，对于备库节点在数据库服务和流复制状态都正常的情况下，如果用show pool_nodes显示的是‘down’状态，可以使用pcp_attach_node重新注册备库节点，使节点状态恢复正常。

KingbaseES V8R3集群维护案例之---pcp_node_refresh应用的更多相关文章

KingbaseES V8R3集群维护案例之---在线添加备库管理节点
案例说明: 在KingbaseES V8R3主备流复制的集群中 ,一般有两个节点是集群的管理节点,分为master和standby:如对于一主二备的架构,其中有两个节点是管理节点,三个数据节点:管理节 ...
KingbaseES V8R6集群维护案例之---停用集群node_export进程
案例说明: 在KingbaseES V8R6集群启动时,会启动node_exporter进程,此进程主要用于向kmonitor监控服务输出节点状态信息.在系统安全漏洞扫描中,提示出现以下安全漏洞: 对 ...
KingbaseES V8R6集群维护案例之---将securecmdd通讯改为ssh案例
案例说明: 在KingbaseES V8R6的后期版本中,为了解决有的主机之间不允许root用户ssh登录的问题,使用了securecmdd作为集群部署分发和通讯的服务,有生产环境通过漏洞扫描,在88 ...
KingbaseES V8R6集群维护案例之--单实例数据迁移到集群案例
案例说明: 生产环境是单实例,测试环境是集群,现需要将生产环境的数据迁移到集群中运行,本文档详细介绍了从单实例环境恢复数据到集群环境的操作步骤,可以作为生产环境迁移数据的参考. 适用版本: Kingb ...
KingbaseES V8R6集群维护案例之--修改securecmdd工具服务端口
案例说明: 在一些生产环境,为了系统安全,不支持ssh互信,或限制root用户使用ssh登录,KingbaseES V8R6可以使用securecmdd工具支持主机之间的通讯.securecmdd工具 ...
KingbaseES V8R3集群管理维护案例之---集群迁移单实例架构
案例说明: 在生产中,需要将KingbaseES V8R3集群转换为单实例架构,可以采用以下方式快速完成集群架构的迁移. 适用版本: KingbaseES V8R3 当前数据库版本: TEST=# s ...
KingbaseES V8R3集群管理和维护案例之---failover切换wal日志变化分析
案例说明: 本案例通过对KingbaseES V8R3集群failover切换过程进行观察,分析了主备库切换后wal日志的变化,对应用者了解KingbaseES V8R3(R6) failover ...
KingbaseES V8R3集群运维案例之---主库系统down failover切换过程分析
案例说明: KingbaseES V8R3集群failover时两个cluster都会触发,但只有一个cluster会调用脚本去执行真正的切换流程,另一个有对应的打印,但不会调用脚本,只是走相关的 ...
KingbaseES V8R3集群运维案例之---用户自定义表空间管理
案例说明: KingbaseES 数据库支持用户自定义表空间的创建,并建议表空间的文件存储路径配置到数据库的data目录之外.本案例复现了,当用户自定义表空间存储路径配置到data下时,出现的故障问 ...
KingbaseES V8R6集群维护之--修改数据库服务端口案例
案例说明: 对于KingbaseES数据库单实例环境,只需要修改kingbase.conf文件的'port'参数即可,但是对于KingbaseES V8R6集群中涉及到多个配置文件的修改,并且在应 ...

随机推荐

log4j 完美版配置
百度的LOG4J配置记录一下目前无时间阅读,反正能用就行了 # priority :debug<info<warn<error #you cannot specify every ...
Office 2016 专业版打开Excel空白解决方案
一.打开注册表 1.Win+R 输入 regedit 回车 2.找到路径 HKEY_CLASSES_ROOT\Excel.Sheet.12\shell\Open\command 更改默认值为 &quo ...
【Oculus Interaction SDK】（十）在 VR 中使用手势识别
前言前段时间 Oculus 的 SDK 频繁更新,很多已有的教程都不再适用于现在的版本了.本系列文章的主要目的是记录现版本常见功能的实现方法,便于自己后续开发.当然,不排除我文章刚写完 SDK 又变 ...
安卓逆向 HOOK 第一课 XP的安装以及编写
<meta-data android:name="xposedmodule" android:value="true" /> <meta-da ...
WPF ScrollViewer 没有效果
ScrollViewer组件外组件如果是StackPanel组件需要给StackPanel 设置高度,ScrollViewer 才会有滚动条如果不想设置StackPanel高度,可以把StackP ...
Golang如何快速构建一个CLI小工示例
这篇文章主要为大家介绍了Golang如何快速构建一个CLI小工具详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪如何Golang快速构建一个CLI小工具在现实开发的 ...
Access数据库使用
简单介绍创建表,设置表属性,内容双击打开软件,新建空白数据库上面创建--表,右侧右键点击表1,选择保存,输入表名称. 左侧右键点击表--打开设计视图设置表内容及格式,首行默认为主键,需右键点主键 ...
mysql8.0.30主从配置
安装包下载地址: https://downloads.mysql.com/archives/community/ 1. 解压介质包: # tar xf mysql-8.0.30-linux-glibc ...
loj3076
参照 E_Space 的候选队论文,我们建出广义串并联图进行「删一度点」「缩二度点」「叠合重边」操作合并信息的表达式树. 我们把其描述成一颗 Leafy Tree. 我们不妨在每个叶节点处存一个点或者 ...
mybatis动态标签——sql标签
mapper接口 Emp getEmpById(@Param("id") Integer id); mapper.xml <!-- sql片段:可以记录一段sql,在需要用的 ...

KingbaseES V8R3集群维护案例之---pcp_node_refresh应用

KingbaseES V8R3集群维护案例之---pcp_node_refresh应用的更多相关文章

随机推荐

热门专题