一、项目背景

  由于当前生产环境RocketMQ机器使用年限较长,已经过保,并且其中一台曾经发生过异常宕机事件。并且早期网络规划较乱,生产、开发、测试等网络没有分开,公司决定对当前网络进行规划,区分各个环境网段、机柜,涉及到MQ集群需要迁移,由于物理机比较老旧,使用决定使用新机器替换老机器,并且之前的MQ集群为多master模式,当master宕机是会导致部分消息不可消费,决定将模式同时修改为多master多slave同步双写同步刷盘模式(本公司生产MQ压力较小,如果MQ压力大可以使用异步刷盘模式)

二、多master多slave集群功能性测试及集群测试结果如下

三、迁移步骤及遇到问题和解决方案

1.更新当前topic路由负载到所有broker上

执行该操作的原因:由于公司RocketMQ早期上线是没有深入研究,很多特性都不很了解,够用就行,很多地方没有考虑到。经过测试环境测试并查看生产MQ路由现象,发现如果topic首次发送的消息30秒内少于(N-)*+1个(N表示master个数),那么该topic路由只会存在部分broker上,这样会存在两个问题:.topic无法达到负载均衡的效果 .如果topic所在的broker宕机,会导致该topic无法生产及消费
topic路由更新方案(二选一,具体看你心情选择)

1.1.通过rocketmq控制台修改(生产验证通过)

1.2.使用其他broker上的Topics.json文件替换本地,该文件在storePathRootDir配置项指定的的目录下config目录内,替换后重启服务生效(生产验证通过)

注意事项:通常Topics.json文件会从当前MQ集群的第一台机器上拷贝。例,我们当前生产MQ集群分别为158. 158.8 158.9 ,集群中第一台broker为158.,默认情况下如果不人为指定topic路由信息,其他两台可能不会存在所以的topic路由,但是,第一台(158.7)通常会都拥有所以topic的路由信息

2.依次修改当前生产MQ集群模式,由多master修改为多master多slave模式,并设置同步双写同步刷盘(后续模式看具体情况定),步骤忽略,会主从部署添加slave应该不在话下,此步操作无风险

3.关闭一台master,并等待slave消息消费完毕,注意下面的操作步骤:

.首先先通知nameserver,我这台broker马上要下线啦,不要再给我发消息啦,阿里提供的命令如下
sh mqadmin wipeWritePerm -b brokerName -n namesrvAddr
实际执行的命令为
sh mqadmin wipeWritePerm -b broker-a -n 172.16.158.7:
sh mqadmin wipeWritePerm -b broker-a -n 172.16.158.8:
sh mqadmin wipeWritePerm -b broker-a -n 172.16.158.9:
有几台nameserver就执行几次,虽然帮助问题提示可以以;符号为分隔符,一次写入多个,但是执行报错
2.等待1~2分钟后关闭当前broker(因为延迟类消息slave无法消费,所以略微多等一下)
sh mqshutdown broker #关闭broker

4.修改master的IP地址或者关机,修改slaveIP地址为master地址并修改配置文件为master模式,重启生效

碰到的问题:
slave升级为master时,查看日志,日志文件有大量"WARN ScheduleMessageTimerThread - findMapedFileByOffset offset not ..." 日志,并且消息无法写入
解决方法:
删掉当前服务器storePathRootDir配置项指定的的目录下所有,在启动服务,拷贝其他服务器Topics.json到本地,在重启(生产验证通过,也许有更简单的方法,暂时没想到)

5.参照3、4步骤依次修改其他两个broker集群

6.为新master添加slave

RocketMQ多master迁移至多master多slave模式的更多相关文章

  1. RocketMQ多Master多Slave模式部署

    每个 Master 配置一个 Slave,有多对Master-Slave,HA采用同步双写方式,主备都写成功,向应用返回成功. 优点:数据与服务都无单点,Master宕机情况下,消息无延迟,服务可用性 ...

  2. MySQL master/slave 模式

    1 .复制 Mysql内建的复制功能是构建大型,高性能应用程序的基础.将Mysql的数据分布到多个系统上去,这种分布的机制,是通过将Mysql的某一台主机的 数据复制到其它主机(slaves)上,并重 ...

  3. ActiveMQ集群支持Master/Slave模式

    现在ActiveMQ, 在Failover方面有两种解决方案:Pure Master Slave和Shared File System Master Slave.      先看Pure Master ...

  4. hadoop的master和slave模式

    hadoop的集群是基于master/slave模式. namenode和jobtracker属于master,datanode和tasktracker属于slave,master只有一个,而slav ...

  5. Mysql在master上查看有哪些slave

    mysql> select * from information_schema.processlist as p where p.command = 'Binlog Dump'; 或 mysql ...

  6. redis配置master-slave模式

    由于云服务器存在闪断现象,项目线上会存在基于redis的功能在闪断时段内出现异常,所以redis需要做master-slave模式.直接上代码: 原单机redis,RedisConnectionFac ...

  7. jenkins的Master/Slave模式

    一. Master/Slave模式 分担jenkins服务器的压力,任务分配到其它执行机来执行 Master:Jenkins服务器 Slave:执行机(奴隶机).执行Master分配的任务,并返回任务 ...

  8. jmeter的master远程运行和停止slave

    jmeter可以部署成master-slave或者叫client-server模式,一个master(client)可以同时控制多个slave(server). 在linux系统下,master(cl ...

  9. Jenkins—Master/Slave模式

    Jenkins可部署在windows或者linux平台上,项目系统的用户多数为windows系统.如果Jenkins部署在linux上,而自动化任务要在windows平台执行,那么就需要使用Jenki ...

随机推荐

  1. 【BZOJ4823】[CQOI2017]老C的方块(网络流)

    [BZOJ4823][CQOI2017]老C的方块(网络流) 题面 BZOJ 题解 首先还是给棋盘进行黑白染色,然后对于特殊边左右两侧的格子单独拎出来考虑. 为了和其他格子区分,我们把两侧的这两个格子 ...

  2. 网站的favicon图标

    网站的favicon图标 favicon.ico一般用于作为缩略的网站标志,它显示在浏览器的地址栏或者标签上. 制作favicon图标 把图片转换为png图片 把png图片转换为ico图标,这需要借助 ...

  3. IP地址网段表示法

    172.12.34.0/25 子网掩码:用于表示IP地址中的多少位用来做主机号.因为"其中值为1的比特留给网络号和子网号,为0的比特留给主机号"(TCP/IP V1). 172.1 ...

  4. JavaScript 日期

    JavaScript 日期 JavaScript 日期输出 默认情况下,JavaScript将使用浏览器的时区并将日期格式显示为全文本字符串: Tue Apr 02 2019 09:01:19 GMT ...

  5. Dynamics CRM 中Web API中的深度创建(Deep Insert)

    我是微软Dynamics 365 & Power Platform方面的工程师罗勇,也是2015年7月到2018年6月连续三年Dynamics CRM/Business Solutions方面 ...

  6. 开源项目Telegram源码 Telegram for Android Source

    背景介绍 Telegram 是一款跨平台的即时通信软件,它的客户端是自由及开放源代码软件.用户可以相互交换加密与自毁消息,发送照片.影片等所有类型文件.官方提供手机版.桌面版和网页版等多种平台客户端. ...

  7. SQL Server阻塞的检查

    1. 阻塞   除了内存.CPU.I/O这些系统资源以外,阻塞和死锁是影响数据库应用性能的另一大因素. 所谓的「阻塞」,是指当一个数据库会话中的事务,正在锁定其他会话事务想要读取或修改的资源,造成这些 ...

  8. 更改docker默认网段

    #本文档旨在说明创建docker时注意的事项:我们在局域网中使用Docker,最常遇到的一个困惑,就是有时候跨网段结果出现网络不通.原因是因为Docker默认生成的网关和我们的局域网网段有时候是冲突的 ...

  9. redis做持久化的两种方式,RDB、AOF讲解

    redis的两种持久化方式: 1.RDB方式 概念:在指定的时间间隔内保存数据快照 实现方式: 找到redis的安装目录,修改redis的配置文件(redis.conf):① 修改备份的时间间隔:sa ...

  10. ssh-copy-id 实现ssh无密码登录 openssh putty

    ssh-keygen 生成公私钥对 $ssh-keygen ssh-copy-id将本机的公钥复制到远程机器 ssh-copy-id -i .ssh/id_rsa.pub(公钥路径) 用户名字@192 ...