Heartbeat的两个小BUG
1,heartbeat启动不起来
如果你是用了linux-ha.japan里面的repo文件,Yum安装pacemaker+heartbeat时。
可能会发现打了service heartbeat start后什么反应也没有。
其实是这个网站里的软件默认配置写错了,做以下的修改就能解决。
vi /usr/lib/ocf/resource.d/heartbeat/.ocf-directories
: ${HA_BIN:=/usr/libexec/heartbeat}
改成
: ${HA_BIN:=/usr/lib64/heartbeat}
cp /usr/libexec/heartbeat/* /usr/lib64/heartbeat/
这个BUG只有用pacemaker+heartbeat才有,pacemaker+corosync时没有。
2,IPaddr2 模块不监控网卡状态
/usr/lib/ocf/resource.d/heartbeat/IPaddr2
这个模块去看一下代码就知道了,他不关心网卡的状态,网卡down掉也不会切换。
有的网站上说配置一个pingd的资源来监视ping可以解决这个问题。
但是我做了测试,有一种情况下pingd也无法解决问题,就是网线掉了。。。
有人会问,网线掉了IP肯定ping不通了啊?pingd怎么会监视不到?
我们的linux服务器里面有个叫NetworkManager的服务,默认是开启的,
当网线掉了的时候,他会去判断网卡的状态,发现是unplug后就会清掉IP信息。
但是这个家伙经常会自作主张的去修改路由信息,所以做服务器的时候往往会把它关掉。
当NetworkManager不再运行的时候,拔掉网线,在什么也不做的情况下,
自己ping自己的IP仍然是通的(虚拟机可能在vshpere等的控制下IP会被清掉),
而heartbeat的网络监视方法就是自己ping自己,因此,ping就会判断错误。
不相信的同学可以去找台物理服务器试试看。
解决方法很简单,让IPaddr2加一个网卡状态判断,如果不是up状态就切换。
vi /usr/lib/ocf/resource.d/heartbeat/IPaddr2
找到ip_monitor()
在注解文字的直下加上一段代码
t=$(ip link show "$NIC" | grep -c "state UP")
test $t -ne 1 && return $OCF_ERR_PERM
这样做后检测失败会在crm里留下错误记录,记录累计到一定的次数资源就会强制失效,
所以还要在资源里加上
primitive vip ocf:heartbeat:IPaddr2 \
params ip="10.100.1.102" cidr_netmask="24" \
op monitor interval="10" timeout="20" \
meta failure-timeout="120"
定期清理vip的错误信息,这个时间不能设太短,否则备机还没有接管,信息就清理掉的话会导致failover失败.
Heartbeat的两个小BUG的更多相关文章
- 解决JqueryUI 拖放排序遇到滚动条时有可能无法执行排序的小bug
前些日子不是在做 使用Jquery-UI实现一次拖拽多个选中的元素操作嘛,在持续完善这个组件时遇到了一个关于拖放排序的bug.今天就着图片和代码重现一下,也顺便告诉大家如何解决这个问题. 首先先上图描 ...
- 小BUG大原理:重写WebMvcConfigurationSupport后SpringBoot自动配置失效
一.背景 公司的项目前段时间发版上线后,测试反馈用户的批量删除功能报错.正常情况下看起来应该是个小 BUG,可怪就怪在上个版本正常,且此次发版未涉及用户功能的改动.因为这个看似小 BUG 我了解到不少 ...
- 小BUG大原理 | 第一篇:重写WebMvcConfigurationSupport后SpringBoot自动配置失效
一.背景 公司的项目前段时间发版上线后,测试反馈用户的批量删除功能报错.正常情况下看起来应该是个小BUG,可怪就怪在上个版本正常,且此次发版未涉及用户功能的改动.因为这个看似小BUG我了解到不少未知的 ...
- 从一个小Bug,到Azure DevOps
1. 一个小Bug 最近和同事提起一个几年前的 Bug,那是一个很小很小的 Bug,没什么技术含量.那时候我刚入职,正好公司卖了一款仪器到某个国家,但是那边说配套的软件运行不起来,一打开就报错.经过排 ...
- Chrome出了个小bug:论如何在Chrome下劫持原生只读对象
Chrome出了个小bug:论如何在Chrome下劫持原生只读对象 概述 众所周知,虽然JavaScript是个很灵活的语言,浏览器里很多原生的方法都可以随意覆盖或者重写,比如alert.但是为了保证 ...
- 淘宝WAP版小BUG分析
前几天发现的一个淘宝WAP版的小BUG,就是用桌面版chrome看的时候产品评价中的图片显示不出来,都是图裂了. 这是什么原因呢?图片为什么会显示不出来呢?淘宝的技术人员.测试人员不可能没发现啊.开启 ...
- ASP.NET MVC 开发中遇到的两个小问题
最近在做一个网站,用asp.net MVC4.0来开发,今天遇到了两个小问题,通过查找相关渠道解决了,在这里把这两个问题写出来,问题非常简单,不喜勿喷,mark之希望可以给遇到相同问题的初学者一点帮助 ...
- pyhton 查找一个数的所有因子 以及 判断一个数是否是质数 两个小脚本
最近看到一个网站, 欧拉计划.挺好玩,都是一些算法题.这是本站:http://projecteuler.net/problems 这个是中文站:http://pe.spiritzhang.com/ 下 ...
- 关于一个小bug的修正
python初学者,非常喜欢虫师的文章. 练习时发现一个小bug,http://www.cnblogs.com/fnng/p/3782515.html 验证邮箱格式一题中,第三个x不允许有数字,但是测 ...
随机推荐
- js处理用户输入的银行卡号实现四位一段,并且只能输入数字
其中ABC是输入框的id.type="tel"可直接呼出数字键盘. <input type="tel" maxlength="24" ...
- php判断 !==false
测试 if($res !== false){ echo "未定义通过<br>"; }else{ echo "未定义不通过<br>"; } ...
- 学习java第二天
首先我们要知道,java是特分大小写的,基本上分为 类名 我们统一小写 如果是多级的 我们用点来隔开 比如 file.test.number1,类或者接口的话基本上大家都是首字母大写,常量全部大写,然 ...
- 单链表在不知头结点的情况下对第i个元素的删除
一.首先,看看单链表中第i个元素的删除: Status ListDelete_L (LinkList &L,int i,ElemType &e){ //在带头结点的单链表L中,删除第i ...
- C#算法之向一个集合中插入随机不重复的100个数
一道非常经典的C#笔试题: 需求:请使用C#将一个长度为100的int数组,插入1-100的随机数,不能重复,要求遍历次数最少. 1.最简单的办法 var rd = new Random(); Lis ...
- Eclipse相关设置
eclipse 默认设置的换行长度, 格式化代码后,同一个方法里面参数也经常被,换行,非常难看. 1.Java代码打开Eclipse的Window菜单,然后 Preferences->Java- ...
- MS sql server 基础知识回顾(二)-表连接和子查询
五.表连接 当数据表中存在许多重复的冗余信息时,就要考虑将这些信息建在另一张新表中,在新表中为原表设置好外键,在进行数据查询的时候,就要使用到连接了,表连接就好像两根线,线的两端分别连接两张表的不同字 ...
- 2.Mybatis入门程序(单表的增删改成)
这里讲的单表的增删改查,是由mapper代理的增删改查,先来看看步骤: 1.jar包的导入 2.配置全局的配置文件 3.建立接口 4.编写mapper.xml 5.测试 工程结构:这个你们自己可以调整 ...
- SqlServer2008R2附件数据库失败
MSSQL附加数据库时提示以下错误: 无法打开物理文件“***.mdf”.操作系统错误 5:“5(拒绝访问.)”. (Microsoft SQL Server,错误: 5120) 该经验介绍如何处理该 ...
- shell和bat 监控进程,自动关机
1.linux 下监控进程,进程结束后关机 新建文件 monit.sh $chmod +x monit.sh 加入代码 #!/bin/sh a=; ]; do |;then echo "sh ...