RHCS集群
理论基础:
User → HA → Lb → web → sql → 分布式filesystem ->磁盘I/O
用户 高可用 负载均衡 应用 数据库 mfs/hadoop
磁盘I/O是硬伤,前面的各个厂商基本都可以做到最好,虽然可以考虑换成固态硬盘,但是固态的价格就目前来看相对比较昂贵,实际情况下显然不现实。
红帽集群套件 RHCS
红帽集群套件管理器 RHCSM
集群配置管理工具 conga
luci :8084<-web<-user
/\ vip
/ \ service(web)
ricci <--> ricci filesystem
HA
cman 核心套件
rgmanage 集群资源管理器
lvm2-cluster lvm支持
sg3_utils 支持scsi
gfs2-utils 分布式文件系统支持
注:ricci只负责与luci连接进行集群配置
真正的集群服务为:
cman
rgmanage
modclusterd
clvmd
server33 <-> server34
\ /
\ /
\ HA /
share storage
当server33的网卡坏了,server33和server34都会认为对方挂掉了,双方同时接管资源,用户在访问的时候因为server33的网卡坏的,无法访问,只能访问server34,因此在用户看来,服务是没有问题的。
当server33昏迷后,此时server34接管资源,但是当server33恢复后,还占据着原来的资源,此时用户访问时就不知道该访问哪台主机了。因此需要第三方设备来解决此问题,即Fence!
Fence
/ \
/ \ 一整套资源:
/ HA \ vip
server33 <-> server34 service
\ / stroage
\ /
\ /
share storage
server33和server34连接着Fence,当有其中一方挂掉之后,虽然双方都会认为对方挂掉了,但是另一方仍然可以连接到Fence,可以通过向fence所在主机发送请求将对方主机进行断电处理,自己接管资源。当故障主机恢复后,将成为备份主机,不再是master,也不会争抢资源。
存储方式
SAN存储(iscsi):服务端共享出设备,在客户端上进行分区,格式化才能使用。即文件系统在客户端上
NAS存储(NFS):在服务端上进行分区,格式化。客户端上只需进行mount操作即可使用。
配置:
系统环境: rhel6 x86_64 iptables and selinux disabled
主机: 192.168.122.119 server19.example.com
192.168.122.25 server25.example.com
192.168.122.1 desktop36.example.com
yum仓库配置:
[rhel-source]
name=Red Hat Enterprise Linux $releasever - $basearch - Source
baseurl=ftp://192.168.122.1/pub/yum
enabled=1
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-release
[HighAvailability]
name=Instructor Server Repository
baseurl=ftp://192.168.122.1/pub/yum/HighAvailability
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-release
enabled=1
[LoadBalancer]
name=Instructor Server Repository
baseurl=ftp://192.168.122.1/pub/yum/LoadBalancer
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-release
enabled=1
[ResilientStorage]
name=Instructor Server Repository
baseurl=ftp://192.168.122.1/pub/yum/ResilientStorage
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-release
enabled=1
[ScalableFileSystem]
name=Instructor Server Repository
baseurl=ftp://192.168.122.1/pub/yum/ScalableFileSystem
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-release
enabled=1
#启动luci
以下步骤在server19和server25上实施:
[root@server19 ~]# yum install ricci -y
[root@server19 ~]# passwd ricci
[root@server19 ~]# chkconfig ricci on
[root@server19 ~]# /etc/init.d/ricci start
以下步骤在desktop36上实施:
[root@desktop36 ~]# yum install luci -y
[root@desktop36 ~]# /etc/init.d/luci start

启动成功系统会给出一个网址,访问此网址(例如上图网址为http://desktop36.example.com:8084),访问时注意在desktop36的/etc/hosts中写上解析.
下载证书,并以desktop36的root身份登录,会显示homebase页面
注:luci登录时可以使用luci所在电脑上的本机用户登录,但是只有root用户才可以管理集群
#创建集群
选择Manage Clusters
选择Create
按照如下图配置创建集群
注:集群名称小于15个字符
选择Download Packages有两层含义:
1.当节点上没有安装集群软件包的时候,会自动安装相关软件包
2.当节点上已经安装了集群软件包的时候,会自动检查更新并安装
创建成功后出现类似如下页面:
#配置Fence设备
以下步骤在desktop36上实施:
[root@desktop36 ~]# yum list fence*
[root@desktop36 ~]# yum install fence-virtd.x86_64 fence-virtd-libvirt.x86_64 fence-virtd-multicast.x86_64 -y
[root@desktop36 ~]# fence_virtd -c
Module search path [/usr/lib64/fence-virt]:
Available backends:
libvirt 0.1
Available listeners:
multicast 1.1
Listener modules are responsible for accepting requests
from fencing clients.
Listener module [multicast]:
The multicast listener module is designed for use environments
where the guests and hosts may communicate over a network using
multicast.
The multicast address is the address that a client will use to
send fencing requests to fence_virtd.
Multicast IP Address [225.0.0.12]:
Using ipv4 as family.
Multicast IP Port [1229]:
Setting a preferred interface causes fence_virtd to listen only
on that interface. Normally, it listens on the default network
interface. In environments where the virtual machines are
using the host machine as a gateway, this *must* be set
(typically to virbr0).
Set to 'none' for no interface.
Interface [none]: virbr0
The key file is the shared key information which is used to
authenticate fencing requests. The contents of this file must
be distributed to each physical host and virtual machine within
a cluster.
Key File [/etc/cluster/fence_xvm.key]:
Backend modules are responsible for routing requests to
the appropriate hypervisor or management layer.
Backend module [checkpoint]: libvirt
The libvirt backend module is designed for single desktops or
servers. Do not use in environments where virtual machines
may be migrated between hosts.
Libvirt URI [qemu:///system]:
Configuration complete.
=== Begin Configuration ===
backends {
libvirt {
uri = "qemu:///system";
}
}
listeners {
multicast {
interface = "virbr0";
port = "1229";
family = "ipv4";
address = "225.0.0.12";
key_file = "/etc/cluster/fence_xvm.key";
}
}
fence_virtd {
module_path = "/usr/lib64/fence-virt";
backend = "libvirt";
listener = "multicast";
}
=== End Configuration ===
Replace /etc/fence_virt.conf with the above [y/N]? y
注:以上设置除“Interface”处填写虚拟机通信接口和Backend module填写libvirt外,其他选项均可回车保持默认。
[root@desktop36 ~]# mkdir /etc/cluster
[root@desktop36 ~]# dd if=/dev/urandom of=/etc/cluster/fence_xvm.key bs=128 count=1
[root@desktop36 ~]# scp /etc/cluster/fence_xvm.key root@192.168.122.119:/etc/cluster/
[root@desktop36 ~]# scp /etc/cluster/fence_xvm.key root@192.168.122.25:/etc/cluster/
[root@desktop36 ~]# /etc/init.d/fence_virtd start
[root@desktop36 ~]# netstat -anuple | grep fence
udp 0 0 0.0.0.0:1229 0.0.0.0:* 0 823705 6320/fence_virtd
注:可查看到1229端口说明fence_virtd启动成功.
测试:
server19的domain为vm1,server25的domain为vm2
在server19上执行 fence_xvm -H vm2,若server25重启说明配置成功
在server25上执行 fence_xvm -H vm1,若server19重启说明配置成功
选择Fence Devices
选择add
按照下列图片进行配置
选择Nodes
按照下列图片对每一个node进行配置
选择Add Fence Method
选择Add Fence Instance
注:此处所填写的Domain与Virtual Machine Manager中此虚拟机的名称一致.
测试:
在server19上执行 echo c > /proc/sysrq-trigger,若server19重启说明配置成功
在server25上执行 echo c > /proc/sysrq-trigger,若server25重启说明配置成功
#在集群中添加集群服务(以apache为例)
以下步骤在server19和server25上实施:
[root@server19 ~]# yum install httpd -y
[root@server19 ~]# echo `hostname` > /var/www/html/index.html
注:无需手动将apache启动起来,将由集群来管理服务.
选择Failover Domains
选择add
按如下图配置
注意:Priority值越低优先级越高,所以以上配置说明192.168.122.119为主节点
选择Resources
选择add
按如下图配置添加IP Address和Script
注:此IP必须是无人使用的.
选择Service Groups
选择add
按如下图配置
选择Add Resouce添加刚才所设置的IP Address和Script并点击Submit
访问192.168.122.147若正常则说明配置成功.
测试:
可通过执行 watch clustat查看当前集群服务由哪个node接管着(假设刚开始由server19接管)
1.将server19上的httpd服务关闭,查看集群服务是否会由server25接管.
2.在server25上执行ifconfig eth0 down模拟网线断掉,看server25是否被执行断电操作,并且集群服务由server19接管
3.在server19上执行echo c > /proc/sysrq-trigger模拟内核崩溃,看server19是否被执行断电操作,集群服务被server25接管,且当server19重启后服务自动切换回server19上.
#配置共享存储
以下步骤在desktop36上实施:
先划分出一个分区,类型为Linux LVM.
[root@desktop36 Desktop]# pvcreate /dev/sdb8
[root@desktop36 Desktop]# vgcreate vg_rhelserver6 /dev/sdb8
[root@desktop36 Desktop]# lvcreate -L 3G -n koendemo vg_rhelserver6
[root@desktop36 Desktop]# yum search all iscsi
[root@desktop36 Desktop]# yum install scsi-target-utils.x86_64 -y
[root@desktop36 Desktop]# vim /etc/tgt/targets.conf
<target iqn.2013-07.com.example:server.target1>
backing-store /dev/vg_rhelserver6/koendemo
initiator-address 192.168.122.119
initiator-address 192.168.122.25
</target>
[root@desktop36 Desktop]# /etc/init.d/tgtd start
通过执行tgtadm --lld iscsi --op show --mode target能查看到次设备说明配置成功
以下步骤在server19和server25上实施:
[root@server19 ~]# yum install iscsi-initiator-utils.x86_64 -y
[root@server19 ~]# iscsiadm -m discovery -t st -p 192.168.122.1
[root@server19 ~]# iscsiadm -m node -l
执行fdisk -l可查看到此设备说明成功.
[root@server19 ~]# lvmconf --enable-cluster
[root@server19 ~]# /etc/init.d/clvmd restart
以下步骤在server19或server25上实施:
[root@server19 ~]# fdisk -cu /dev/sdb
将此设备划分分区,一般只划分一个分区,类型为Linux LVM,若划分多个分区为保险期间要注意备份分区表.
[root@server19 ~]# pvcreate /dev/sdb1
[root@server19 ~]# vgcreate -c y koenvg /dev/sdb1
执行vgdisplay查看koenvg的Clustered参数是否为yes.
[root@server19 ~]# lvcreate -L 1G -n koenlv koenvg
[root@server19 ~]# mkfs.gfs2 -p lock_dlm -t koen_007:gfs2 -j 3 /dev/koenvg/koenlv
-p 定义为 DLM 锁方式,如果不加此参数,当在两个系统中同时挂载此分区时就会像 EXT3 格式一 样,两个系统的信息不能同步
-t koen_007 DLM 锁所在的表名字,就是你的集群的名字gfs 分区的卷标
-j GFS 分区中最多支持多少个节点同时挂载,这个可以在使用中动态调整 ,通常设定值为节点数+1
mount -t gfs /dev/koenvg/koenlv /var/www/html (自动挂载可以写入/etc/fstab, 或添加为集群资源,由集群加载) 其他集群节点相同操作,只是不要执行格式化
访问https://desktop36.example.com:8084
选择Service Groups
将集群服务先关闭(Disable)
选择Resources
选择add
按如下图配置
选择Service Groups
选择Add Resouce添加刚才所设置的GFS2并点击Submit
将集群服务启动.
测试:集群服务启动后,当服务在哪个节点上运行时,GFS2设备就挂载在哪个节点的/var/www/html目录下.
附:当集群服务出现故障,无法启动(可用clusvcadm -d apache模拟),gfs2文件系统无法挂载时,如何恢复gfs2文件系统中的数据
以下步骤在任意一个节点上实施:
[root@server19 ~]# dd if=/dev/koenvg/koenlv of=gfs2.img
[root@server19 ~]# yum install gfs2-utils.x86_64 -y
[root@server19 ~]# mount -o loop,lockproto=lock_nolock gfs2.img /mnt/
这样即可查看gfs2文件系统中的数据并对其进行备份
注:建议将dd截得的块(即此处的gfs2.img)scp到非集群节点上进行挂载.
附:gfs2的拉伸
以下步骤在任意一个节点上实施:
[root@server19 ~]# lvextend -L +1000M /dev/koenvg/koenlv
[root@server19 ~]# gfs2_grow /dev/koenvg/koenlv
附:当要添加节点到集群中时,如何给gfs2文件系统添加日志数目.
以下步骤在当前gfs2文件系统所挂节点上实施:
[root@server19 ~]# gfs2_jadd -j 2 /dev/koenvg/koenlv
Filesystem: /var/www/html
Old Journals 3
New Journals 5
注:出现类似如上输出说明添加成功.
[root@server19 ~]# gfs2_tool journals /dev/koenvg/koenlv (可通过此条命令查看日志数,日志数有几个,说明可以有几个节点同时挂载此gfs2文件系统)
附:如何将此集群服务彻底关闭
访问https://desktop36.example.com:8084
选择Service Groups
将集群服务先关闭(Disable)
选择Nodes
将所有节点选中,点击Leave Cluster
以下步骤在server19和server25上实施:
[root@server19 ~]# /etc/init.d/cman stop
[root@server19 ~]# chkconfig cman off
[root@server19 ~]# /etc/init.d/rgmanager stop
[root@server19 ~]# chkconfig rgmanager off
[root@server19 ~]# /etc/init.d/modclusterd stop
[root@server19 ~]# chkconfig modclusterd off
[root@server19 ~]# /etc/init.d/ricci stop
[root@server19 ~]# chkconfig ricci off
[root@server19 ~]# /etc/init.d/iscsi stop
[root@server19 ~]# chkconfig iscsi off
[root@server19 ~]# /etc/init.d/iscsid stop
[root@server19 ~]# chkconfig iscsid off
以下步骤在desktop36上实施:
[root@desktop36 ~]# /etc/init.d/fence_virtd stop
[root@desktop36 ~]# chkconfig fence_virtd off
[root@desktop36 ~]# /etc/init.d/luci stop
[root@desktop36 ~]# chkconfig luci off
RHCS集群的更多相关文章
- 管理和维护RHCS集群
导读 管理和维护RHCS集群是一个非常复杂和繁琐的工作,要维护好一个RHCS集群,必须熟悉RHCS的基本运行原理,在集群管理方面,RHCS提供了两种方式:即Luci图形界面方式和命令行方式,这儿重点讲 ...
- RHCS集群理论暨最佳实践
RHCS集群理论暨 最佳实践 什么是集群? 集群是一组(>2)相互独立的,通过高速网络互联的计算机组成的集合.群集一般可以分为科学集群,负载均衡集群,高可用性集群三大类. 科学集 ...
- 又是干货,这个春节感觉吃饱了。各方面---RHCS集群理论
什么是集群? 集群是一组(>2)相互独立的,通过高速网络互联的计算机组成的集合.群集一般可以分为科学集群,负载均衡集群,高可用性集群三大类. 科学集群是并行计算的基础.它对外就好象一 ...
- [Colony]RHCS集群理论
什么是集群? 集群是一组(>2)相互独立的,通过高速网络互联的计算机组成的集合.群集一般可以分为科学集群,负载均衡集群,高可用性集群三大类. 科学集群是并行计算的基础.它对外就好 ...
- linux RHCS集群 高可用web服务器
RHCS集群,高可用服务器 高可用 红帽集群套件,提供高可用性,高可靠性,负载均衡,快速的从一个节点切换到另一个节点(最多16个节点)负载均衡 通过lvs提供负载均衡,lvs将负载通过负载分配策略,将 ...
- centos6.5环境基于conga的web图形化界面方式配置rhcs集群
一.简介 RHCS 即 RedHat Cluster Suite ,中文意思即红帽集群套件.红帽集群套件(RedHat Cluter Suite, RHCS)是一套综合的软件组件,可以通过在部署时采用 ...
- Centos6.5搭建RHCS集群-实现GFS+iSCSI网络共享存储
RHCS集群配置 需要用到的各组件功能:RHCS(Red Hat Cluster Suite):能够提供高可用性.高可靠性.负载均衡.存储共享且经济廉价的集群工具集合.LUCI:是一个基于web的集群 ...
- Cluster基础(四):创建RHCS集群环境、创建高可用Apache服务
一.创建RHCS集群环境 目标: 准备四台KVM虚拟机,其三台作为集群节点,一台安装luci并配置iSCSI存储服务,实现如下功能: 使用RHCS创建一个名为tarena的集群 集群中所有节点均需要挂 ...
- RHCS集群架构之mysql及共享存储iscsi
server1 172.25.7.1(配置Nginx.ricci和luci) server2 172.25.7.2(Apache.iscsi) server3 172.25.7.3(Apache) s ...
随机推荐
- Django开发网站(二)
第一课:视图显示 1 建立一个项目:django-admin startproject blog, 进入blog: cd blog 显示:blog(__init__.py settings.py ...
- 【转】perl如何避免脚本在windows中闪一下就关闭
写好了perl程序,运行后,准备等待结果输出时,结果双击后,看到屏幕闪了一下,然后什么都没有了,根本没有机会然你看到输出的结果 当你刚开始学习perl的时候,写好了程序,准备兴高采烈的等待结果输出时, ...
- 1.JSP 简介及工作原理
1.JSP 简介 JSP(Java Server Pages)是由Sun Microsystems公司倡导.许多公司参与一起建立的一种动态网页技术标准.JSP技术有点类似ASP技术,它是在传统的网页H ...
- Arcgis 10.1中空间连接功能
空间链接的作用:将面上的所有点的值加起来取平均值.赋值给面属性.(我们可以定义右击——定义合并规则 连接要素的字段映射参数中指定的合并规则仅适用于连接要素中的属性,且仅适用于多个要素与目标要素匹配 ( ...
- gridView AspNetPager 翻页时 弹出窗体关闭报错
gridView AspNetPager 翻页后,你右击刷新或F5会发现弹出一个刷新页面. 这是因为默认翻页都是用dopostback方式回发的.因为这时的页面已经不是原来的页面.所以会弹出提示. 这 ...
- Xcode免证书打包ipa
1,创建证书 打开“钥匙串访问”创建证书 填写好内容后点击继续,之后的步骤什么都不用改,一路点击“确定”和“继续”,最后完成这个向导就可以了. 我们创建的证书是不被信任的,右键点击证书选择“显示简介” ...
- 【BZOJ1305】 [CQOI2009]dance跳舞
Description 一次舞会有n个男孩和n个女孩.每首曲子开始时,所有男孩和女孩恰好配成n对跳交谊舞.每个男孩都不会和同一个女孩跳两首(或更多)舞曲.有一些男孩女孩相互喜欢,而其他相互不喜欢(不会 ...
- 【BZOJ1468】Tree
Description 给你一棵TREE,以及这棵树上边的距离.问有多少对点它们两者间的距离小于等于K Input N(n<=40000) 接下来n-1行边描述管道,按照题目中写的输入 接下来是 ...
- ios 中定时器:NSTimer, CADisplayLink, GCD
#import "ViewController.h" #import "RunloopViewController.h" @interface ViewCont ...
- 1199: [HNOI2005]汤姆的游戏 - BZOJ
Description 汤姆是个好动的孩子,今天他突然对圆规和直尺来了兴趣.于是他开始在一张很大很大的白纸上画很多很多的矩形和圆.画着画着,一不小心将他的爆米花弄撒了,于是白纸上就多了好多好多的爆米花 ...