Oracle 集群心跳及其參数misscount/disktimeout/reboottime

在Oracle RAC中，能够从多个层次，多个不同的机制来检測RAC的健康状况，即能够通过心跳机制以及一定的投票算法来隔离故障。假设检測到某节点失败，则存在故障的节点将会被逐出集群以避免故障节点破坏数据。本文主要描写叙述了Oracle RAC下的几种心跳机制以及心跳參数的调整。

一、OCSSD与CSS
OCSSD是一个管理及提供Cluster Synchronization Services (CSS)服务的Linux或者Unix进程。使用Oracle用户来执行该进程并提供节点成员管理功能，一旦该进程失败。将导致节点重新启动。CSS服务提供2种心跳机制。一种为网络心跳。一种为磁盘心跳。两种心跳都有最大延时，网络心跳的延时叫MC(Misscount)，磁盘心跳延时叫作IOT (I/O Timeout)。

这2个參数都以秒为单位。缺省时情况下Misscount < Disktimeout。

以下分别描写叙述这2种心跳机制。

二、网络心跳
    故名思义即是通过私有网络来检測节点的状态。假设私有网络硬件、软件导致集群节点间私有网络在一定时间内无法进行正常通信。由此而导致脑裂。由于集群环境中的存储为共享存储，因此此时必须要将故障节点从集群隔离出来，以避免数据灾难。关于这个网络心跳的详细动作描写叙述例如以下：
   Every one second, a sending thread in the cssd sends a network tcp heartbeat to itself and all nodes. The receiving thread of the ocssd.bin receives the heartbeat.
    If the package network is dropped or has error, the error correction mechanism on tcp would retransmit the package.
    Oracle does not retransmit. From the ocssd.log, you will see a WARNING message about missing of heartbeat if a node does not receive a heartbeat from another node for 15 seconds (50% of miscount).  Another warning is reported in ocssd.log if the same node is missing for 22 seconds (75% of miscount)..another warning continues from the same node for 27 seconds (90% miscount).  When the heartbeat is missing 100% ..30 seconds miscount, the node is evicted

   这个网络心跳的延迟称之为misscount，能够通过crsctl 工具查询及改动。
   [grid@Linux-01 ~]$ crsctl get css misscount
   CRS-4678: Successful get misscount 30 for Cluster Synchronization Services.

   上面的查询结果表明，假设集群各节点间内联网络延迟大于30s，Oracle觉得节点间发生了脑裂，须要将故障节点逐出集群。

怎样寻找故障节点。Oracle则通过投票算法来决定，以下是一个算法描写叙述演示样例，描写叙述參考大话Oracle RAC。
集群中各个节点须要心跳机制来通报彼此的"健康状态"。假设每收到一个节点的"通报"代表一票。对于三个节点的集群。正常执行时，每一个节点都会有3票。当结点A心跳出现故障但节点A还在执行，这时整个集群就会分裂成2个小的partition。

节点A是一个。剩下的2个是一个。

这是必须剔除一个partition才干保障集群的健康执行。对于这3个节点的集群， A 心跳出现故障后， B 和 C 是一个partion，有2票， A仅仅有1票。

依照投票算法。 B 和C 组成的集群获得控制权。 A 被剔除。假设仅仅有2个节点，投票算法就失效了。

由于每一个节点上都仅仅有1票。这时就须要引入第三个设备：Quorum Device. Quorum Device 通常採用的是共享磁盘，这个磁盘也叫作Quorum disk。这个Quorum Disk 也代表一票。当2个结点的心跳出现故障时， 2个节点同一时候去争取Quorum Disk 这一票，最早到达的请求被最先满足。

故最先获得Quorum Disk的节点就获得2票。还有一个节点就会被剔除。

节点一旦被隔离之后，在11gR2之前一般是重新启动故障节点。

而在11gR2中。ClusterWare会首先尝试关闭该节点的全部资源，尝试对集群中失败的组建进行清理，即重新启动失败的组件。

假设清理失败的组件未成功，为了强制清理，则再对节点进行重新启动。

三、磁盘心跳
A thread in ocssd.bin updates the voting disk every second.
If a node does not update the voting disks for 200 seconds, it's evicted.
However, the ocssd.bin on the local node has the logic that it will bring down the node if it has an I/O error more than majority of the voting disks. Also there is a CRS reconfiguration is happening when misscount is 27 second and the local node is rebooted. As a result, you rarely see an eviction due to failure of the voting disk on 10.2.0.4 (this is more common in 10.2.0.1)) because the ocssd.bin will abort the node before it get evicted by another node if writing to the voting disk is the problem.
如上所述，每一个节点会每一秒钟更新一次表决磁盘。共享的表决磁盘用于检查磁盘心跳。

假设ocssd进程更新表决磁盘的时间超过200s，即disktimeout设定的值。Oracle会觉得该表决磁盘脱机，同一时候在Clusterware的告警日志中生成表决磁盘脱机记录。假设当前节点表决磁盘脱机的个数小于在线表决磁盘的个数，该节点能够幸存，假设脱机表决磁盘的个数大于或等于在线表决磁盘的个数，则clusterware觉得磁盘心跳出现故障。故障节点会被逐出集群。执行自己主动修复过程。

比方有3个表决磁盘。节点A有表决磁盘出现了脱机。此时脱机磁盘(1个)<在线磁盘(2)。clusterware会在告警日志中生成脱机记录，但不採取不论什么行动。假设当前节点有2个或2个以上表决磁盘脱机，此时脱机磁盘(2个)>在线磁盘(1个)。那节点A被踢出集群。

四、RebootTime參数
    注意这个RebootTime參数。也非常重要，缺省情况下为3s。
    Default 3 seconds -the amount of time allowed for a node to complete a reboot
    after the CSS daemon has been evicted.
    crsctl get css reboottime
    #Author : Leshami
    #Blog   : http://blog.csdn.net/leshami

五、心跳參数的调整
1) 10.2.0.2 to 11.1.0.7版本号的改动方法
   a) Shut down CRS on all but one node. For exact steps use note 309542.1
    b) Execute crsctl as root to modify the misscount:
       $CRS_HOME/bin/crsctl set css misscount <n>    #### where <n> is the maximum private network latency in seconds
       $CRS_HOME/bin/crsctl set css reboottime <r> [-force] #### (<r> is seconds)
       $CRS_HOME/bin/crsctl set css disktimeout <d> [-force] #### (<d> is seconds)
    c) Reboot the node where adjustment was made
    d) Start all other nodes which was shutdown in step 1
    e) Execute crsctl as root to confirm the change:
       $CRS_HOME/bin/crsctl get css misscount
       $CRS_HOME/bin/crsctl get css reboottime
       $CRS_HOME/bin/crsctl get css disktimeout

2) 11gR2的改动方法
With 11gR2, these settings can be changed online without taking any node down:

a) Execute crsctl as root to modify the misscount:
       $CRS_HOME/bin/crsctl set css misscount <n>    #### where <n> is the maximum private network latency in seconds
       $CRS_HOME/bin/crsctl set css reboottime <r> [-force] #### (<r> is seconds)
       $CRS_HOME/bin/crsctl set css disktimeout <d> [-force] #### (<d> is seconds)
    b) Execute crsctl as root to confirm the change:
       $CRS_HOME/bin/crsctl get css misscount
       $CRS_HOME/bin/crsctl get css reboottime
       $CRS_HOME/bin/crsctl get css disktimeout

Oracle 集群心跳及其參数misscount/disktimeout/reboottime的更多相关文章

【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之缓存融合技术和主要后台进程（四）
缓存融合技术和主要后台进程(四) 概述:写下本文档的初衷和动力,来源于上篇的<oracle基本操作手册>.oracle基本操作手册是作者研一假期对oracle基础知识学习的汇总.然后形成体 ...
【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之RAC 特殊问题和实战经验（五）
RAC 特殊问题和实战经验(五) 概述:写下本文档的初衷和动力,来源于上篇的<oracle基本操作手册>.oracle基本操作手册是作者研一假期对oracle基础知识学习的汇总.然后形成体 ...
转载:【Oracle 集群】RAC知识图文详细教程(五)--特殊问题和实战经验
文章导航集群概念介绍(一) ORACLE集群概念和原理(二) RAC 工作原理和相关组件(三) 缓存融合技术(四) RAC 特殊问题和实战经验(五) ORACLE 11 G版本2 RAC在LINUX ...
转载:【Oracle 集群】RAC知识图文详细教程(四)--缓存融合技术和主要后台进程
文章导航集群概念介绍(一) ORACLE集群概念和原理(二) RAC 工作原理和相关组件(三) 缓存融合技术(四) RAC 特殊问题和实战经验(五) ORACLE 11 G版本2 RAC在LINUX ...
【转】【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之RAC 特殊问题和实战经验（五）
原文地址:http://www.cnblogs.com/baiboy/p/orc5.html 阅读目录目录共享存储时间一致性互联网络(或者私有网络.心跳线) 固件.驱动.升级包的一致性共 ...
【转】【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之缓存融合技术和主要后台进程（四）
原文地址:http://www.cnblogs.com/baiboy/p/orc4.html 阅读目录目录 Cache Fusion 原理什么是 Cache Fusion? 什么是高可用 FA ...
【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之集群概念介绍（一）
集群概念介绍(一)) 白宁超 2015年7月16日概述:写下本文档的初衷和动力,来源于上篇的<oracle基本操作手册>.oracle基本操作手册是作者研一假期对oracle基础知识学习 ...
Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之ORACLE集群概念和原理（二）
ORACLE集群概念和原理(二) 概述:写下本文档的初衷和动力,来源于上篇的<oracle基本操作手册>.oracle基本操作手册是作者研一假期对oracle基础知识学习的汇总.然后形成体 ...
【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之RAC 工作原理和相关组件（三）
RAC 工作原理和相关组件(三) 概述:写下本文档的初衷和动力,来源于上篇的<oracle基本操作手册>.oracle基本操作手册是作者研一假期对oracle基础知识学习的汇总.然后形成体 ...

随机推荐

fatal error LNK1123: failure during conversion to COFF: file invalid or corr
新装VS2010出现标题的错误,使用了下面的方法,不行这个是由于日志文件引起的,可以将项目\属性\配置属性\清单工具\输入和输出\嵌入清单:原来是"是",改成"否&q ...
XSS【跨站脚本攻击】
从客户端(txt="<script><a href="www...")中检测到有潜在危险的 Request.Form 值. 如果你使用的是.NET 3. ...
mysql errno:13
新装的mysql,创建表时报错误 errno:13,网上查了一下是权限问题.解决方式如下: 到mysql的数据目录下:即启动进程中:--datadir=/data/soft/mysql/mysqlda ...
linux杂记（五）正确关机方法（shutdown，reboot，init，halt）
前言:由于在linux底下,每个程序(或者说是服务)都是在背景下运行的,因此,在你看不到的屏幕背后其实可能有相当多人同时在你的主机上面工作,如果你直接按下电源开关来关机,则可能导致其他人的数据就此中 ...
配置Raspbian 启用SPI I2C
sudo vi /etc/modprobe.d/raspi-blacklist.conf 找到这两行 blacklist spi-bcm2708 blacklist i2c-bcm2708 注释掉 # ...
在FL2440上使用kei MDK 调试程序（J-link）
<一>新建一个工程单击Project ->New µVision Project...菜单项 <二>选择CPU 这里我们选择三星的2440A 点击OK后会提示你是否添加 ...
JAVA泛型-自动包装机制不能应用于泛型数据的测试
<thinging in java>中指出自动包装机制不能应用于泛型数据,自己写的测试代码如下: package com.xt.thinks15_11_1; import java.uti ...
linux shell编程总结
linux shell编程总结本周学习了unix/linux shell编程,参考的是<LINUX与UNIX Shell 编程指南>,David Tansley著:徐焱,张春萌等译,由机 ...
Android模拟器PANIC: Could not open:问题解决方法
最主要的就是环境变量没有配置或者我们使用的是绝对路径配置环境变量.这时我们只需要修改一下Android的环境变量就可以了. 具体解决方法如下: ①在环境变量中创建变量名:ANDROID_SDK_HOM ...
Java图形化界面设计——布局管理器之GridLayout（网格布局）
网格布局特点: l 使容器中的各组件呈M行×N列的网格状分布. l 网格每列宽度相同,等于容器的宽度除以网格的列数. l 网格每行高度相同,等于容器的高度除以网格的行数. l 各组件的排列方式 ...

Oracle 集群心跳及其參数misscount/disktimeout/reboottime

Oracle 集群心跳及其參数misscount/disktimeout/reboottime的更多相关文章

随机推荐

热门专题