每个rabbitmq node运行RabbitMQ application共享用户virtual hosts, queues, exchanges, etc.

一个nodes组称之为一个集群。

所有的RabbitMQ broker上的操作所需要的data/state都是全节点复制,唯一的例外是message queues,,它只存放在创建它的node上,但对所有节点可见/可取。

为了复制message queues到所有节点需要打开mirrored queues。

下面创建一个RabbitMQ brokers集群,打开mirrored queues。
3个节点:
node1 10.15.85.141
node2 10.15.85.142
node3 10.15.85.143
注意:这并非完整的HA方案,仅仅是为了演示非单点故障。

1. 第一步:停掉node-01上的所有OpenStack services
2. 拷贝erlang cookie到其他2个节点:

% scp /var/lib/rabbitmq/.erlang.cookie root@node-:/var/lib/rabbitmq/.erlang.cookie
% scp /var/lib/rabbitmq/.erlang.cookie root@node-:/var/lib/rabbitmq/.erlang.cookie 确保权限为: user 'rabbitmq', group 'rabbitmq'
% chown rabbitmq:rabbitmq /var/lib/rabbitmq/.erlang.cookie
% chmod /var/lib/rabbitmq/.erlang.cookie

3. 启动node-02 和 node-03的RabbitMQ service

% chkconfig rabbitmq-server on
% service rabbitmq-server start

现在有个3个RabbitMQ brokers,下一步就是组建集群并开通 mirrored queues。

4. 让node 2/3加入到node1:

On node-:
# rabbitmqctl stop_app
Stopping node 'rabbit@node-02' ...
...done. # rabbitmqctl join_cluster rabbit@node-
Clustering node 'rabbit@node-02' with 'rabbit@node-01' ...
...done. # rabbitmqctl start_app
Starting node 'rabbit@node-02' ...
...done. On node-:
# rabbitmqctl stop_app
Stopping node 'rabbit@node-03' ...
...done. # rabbitmqctl join_cluster rabbit@node-
Clustering node 'rabbit@node-03' with 'rabbit@node-01' ...
...done. # rabbitmqctl start_app
Starting node 'rabbit@node-03' ...
...done.

现在有了3个节点的RabbitMQ cluster. 查看集群状态:

# rabbitmqctl cluster_status
Cluster status of node 'rabbit@node-01' ...
[{nodes,[{disc,['rabbit@node-01','rabbit@node-02',
'rabbit@node-03']}]},
{running_nodes,['rabbit@node-03','rabbit@node-02',
'rabbit@node-01']},
{partitions,[]}]
...done.

RabbitMQ clustering不能处理网络分割,也就是说不能跨WAN使用, shovel or federation plugins可以解决这个问题。

4.1 集群节点可以随时stop/start

node2$ rabbitmqctl stop

node2$ rabbitmq-server --detached

4.2 集群节点可以随时退出和加入

node2$ rabbitmqctl stop_app

node2$ rabbitmqctl reset

node2$ rabbitmqctl start_app

现在node2独立了。

也可以从node1上移除node2:

node2$ rabbitmqctl stop_app

node1$ rabbitmqctl forget_cluster_node rabbit@node2

注意:这时node2 依然认为它和node1是一个集群,直接重启它会出错,需要reset它:

node2$ rabbitmqctl reset

4.3 为了实验,一个机器上可以运行多个RabbitMQ nodes,前提是每个node的名字和ip/port不同。

详见:

http://www.rabbitmq.com/clustering.html

5. 创建policy来 Enable mirrored queues
% rabbitmqctl set_policy HA '^(?!amq\.).*' '{"ha-mode": "all"}'

详细配置见:

http://www.rabbitmq.com/ha.html

6. 既然消息队列可以从3个任意的RabbitMQ brokers访问,在节点1上setup一个LB HAProxy:

Install haproxy on node-.
% yum install haproxy
Edit /etc/haproxy/haproxy.cfg and create a simple TCP proxy for RabbitMQ.
global
daemon defaults
mode tcp
maxconn
timeout connect 5s
timeout client 100s
timeout server 100s listen rabbitmq 10.15.85.141:
mode tcp
balance roundrobin
server node- 10.15.85.141: check inter 5s rise fall
server node- 10.15.85.142: check inter 5s rise fall
server node- 10.15.85.143: check inter 5s rise fall

haproxy位于10.15.85.141:5670
到这个proxy的连接会round-robin到3个节点上。

7.启动haproxy
% service haproxy start

8.让OpenStack service指向haproxy

Neutron:

openstack-config --set /etc/neutron/neutron.conf DEFAULT rabbit_host 10.15.85.141
openstack-config --set /etc/neutron/neutron.conf DEFAULT rabbit_port
Nova:
openstack-config --set /etc/nova/nova.conf DEFAULT rabbit_host 10.15.85.141
openstack-config --set /etc/nova/nova.conf DEFAULT rabbit_port
Glance:
openstack-config --set /etc/glance/glance-api.conf DEFAULT rabbit_host 10.15.85.141
openstack-config --set /etc/glance/glance-api.conf DEFAULT rabbit_port
Cinder:
openstack-config --set /etc/cinder/cinder.conf DEFAULT rabbit_host 10.15.85.141
openstack-config --set /etc/cinder/cinder.conf DEFAULT rabbit_port
Ceilometer:
openstack-config --set /etc/ceilometer/ceilometer.conf DEFAULT rabbit_host 10.15.85.141
openstack-config --set /etc/ceilometer/ceilometer.conf DEFAULT rabbit_port

9 最后把这个集群写入到配置文件/etc/rabbitmq/rabbitmq.config,这样node启动时会自动创建该集群
[{rabbit,
  [{cluster_nodes, {['rabbit@node-01', 'rabbit@node-02', 'rabbit@node-03'], ram}}]}].

注意:有很多旧文档依然推荐用pacemake和DRBD作为rabbitmq的HA方案,有了queue mirror技术,这个已经过时了。

详见:

http://www.rabbitmq.com/pacemaker.html

High availability with Pacemaker and DRBD

参考:
https://www.rdoproject.org/RabbitMQ
http://blog.flux7.com/blogs/tutorials/how-to-creating-highly-available-message-queues-using-rabbitmq

rabbitmq High Availability的更多相关文章

  1. RabbitMQ概念及环境搭建(四)RabbitMQ High Availability

    #################################################### RabbitMQ High Availability #################### ...

  2. RabbitMQ学习之集群消息可靠性测试

    之前介绍过关于消息发送和接收的可靠性:RabbitMQ学习之消息可靠性及特性 下面主要介绍一下集群环境下,rabbitmq实例宕机的情况下,消息的可靠性.验证rabbitmq版本[3.4.1]. 集群 ...

  3. ActiveMQ, Qpid, HornetQ and RabbitMQ in Comparison

    国内私募机构九鼎控股打造APP,来就送 20元现金领取地址:http://jdb.jiudingcapital.com/phone.html内部邀请码:C8E245J (不写邀请码,没有现金送)国内私 ...

  4. Exploring Message Brokers: RabbitMQ, Kafka, ActiveMQ, and Kestrel--reference

    [This article was originally written by Yves Trudeau.] http://java.dzone.com/articles/exploring-mess ...

  5. rabbitmq Clustering Guide--官方

    官方文档地址:http://www.rabbitmq.com/documentation.html A RabbitMQ broker is a logical grouping of one or ...

  6. Kafka、ActiveMQ、RabbitMQ、RocketMQ 区别以及高可用原理

    为什么使用消息队列 其实就是问问你消息队列都有哪些使用场景,然后你项目里具体是什么场景,说说你在这个场景里用消息队列是什么? 面试官问你这个问题,期望的一个回答是说,你们公司有个什么业务场景,这个业务 ...

  7. FW 构建OpenStack的高可用性(HA,High Availability)

    原文地址:http://blog.csdn.net/hilyoo/article/details/7704280 1.CAP理论 1) CAP 理论给出了3个基本要素: 一致性 ( Consisten ...

  8. RabbitMQ脑裂问题解决方案调查

    现象: RabbitMQ GUI上显示 Network partition detectedMnesia reports that this RabbitMQ cluster has experien ...

  9. Openstack关于Regions和Availability Zones

    在AWS中有Region和Availability Zones的概念,并且在openstack中也实现了两者,只是不太容易看出来. 此文主要介绍他们的概念和关系,以及在openstack中的实现. 如 ...

随机推荐

  1. delphi xe学习随意记录

    学习来源(根据他们的资料整理) 论坛:http://www.coder163.com(有视频) 博客:http://del.cnblogs.com/(万一的博客) 1.1.1    命名规范的概述 1 ...

  2. js滚动显示: 滚动条置顶/底

    <script> //当聊天室的内容超出页面范围时, 如何让页面刷新后 显示最下面的内容 document.getElementByIdx ( 'chatboard').scrollTop ...

  3. css3的clip-path属性

    css3的clip-path属性 网上看到的都是因为2年前一个出名的网站引发了对该属性的研究.所以大概是2年前火了一阵子的属性.2016-09-10  23:54:00 直接开始总结它的用法: 2个基 ...

  4. Oracle数据库命令行下数据的导入导出

    //设置导入导出字符集,导入导出都要设置一下 export NLS_LANG=AMERICAN_AMERICA.ZHS16GBK //导出 exp system/oracle@orcl file=/u ...

  5. 转!!springmvc学习

    springmvc学习 https://www.cnblogs.com/baiduligang/p/4247164.html

  6. 海量数据存储之nosql教程(转)

    add by zhj: 不错的系列,作者介绍了NoSQL数据库,并重点研究了Memcached和Redis,不知道后续是否还有其它NoSQL数据库的文章 海量数据存储之nosql教程之-01基础理论 ...

  7. Java排序算法总结(转载)

    排序算法 平均时间复杂度 冒泡排序 O(n2) 选择排序 O(n2) 插入排序 O(n2) 希尔排序 O(n1.5) 快速排序 O(N*logN) 归并排序 O(N*logN) 堆排序 O(N*log ...

  8. xcode中全文查询某个中文字

    查询所有中文 [^"]*[\u4E00-\u9FA5]+[^"\n]*? 查询某个中文字“中”字 [^"]*[\u4e2d]+[^"\n]*? 中文字转成uni ...

  9. js 实现无限加载分页(适合移动端)

    一.原理:当滚动条到达底部时,执行下一页内容. 判断条件需要理解三个概念:    1.scrollHeight 真实内容的高度    2.clientHeight 视窗的高度,即在浏览器中所能看到的内 ...

  10. (转载)处理SQL解析失败导致share pool 的争用

    通过关联x$kglcursorx$kglcursor_child_sqlid视图: 通过使用Oracle10035Event事件可以找到解析失败的SQL: 通过oraclesystemdump也可以找 ...