[转载]rabbitmq可靠发送的自动重试机制

转载地址http://www.jianshu.com/p/6579e48d18ae

http://www.jianshu.com/p/4112d78a8753

接这篇

在上文中，主要实现了可靠模式的consumer。而可靠模式的sender实现的相对简略，主要通过rabbitTemplate来完成。
本以为这样的实现基本是没有问题的。但是前段时间做了一个性能压力测试，但是发现在使用rabbitTemplate时，会有一定的丢数据问题。

当时的场景是用30个线程，无间隔的向rabbitmq发送数据，但是当运行一段时间后发现，会出现一些connection closed错误，rabbitTemplate虽然进行了自动重连，但是在重连的过程中，丢失了一部分数据。当时发送了300万条数据，丢失在2000条左右。
这种丢失率，对于一些对一致性要求很高的应用(比如扣款，转账)来说，是不可接受的。

在google了很久之后，在stackoverflow上找到rabbitTemplate作者对于这种问题的解决方案，他给的方案很简单，单纯的增加connection数：

connectionFactory.setChannelCacheSize(100);

修改之后，确实不再出现connection closed这种错误了，在发送了3000万条数据后，一条都没有丢失。
似乎问题已经完美的解决了，但是我又想到一个问题：当我们的网络在发生抖动时，这种方式还是不是安全的？
换句话说，如果我强制切断客户端和rabbitmq服务端的连接，数据还会丢失吗？

为了验证这种场景，我重新发送300万条数据，在发送过程中，在rabbitmq的管理界面上点击强制关闭连接：

然后发现，仍然存在丢失数据的问题。

看来这个问题，没有想象中的那么简单了。

在阅读了部分rabbitTemplate的代码之后发现：
1 rabbitTemplate的ack确认机制是异步的
2 这种确认机制是一种事后发现机制，并不能同步的发现问题
也就是说，即便打开了

connectionFactory.setPublisherConfirms(true);

rabbitTemplate.setMandatory(true);

并且实现了：

rabbitTemplate.setConfirmCallback((correlationData, ack, cause) -> {

            if (!ack) {

                log.info("send message failed: " + cause + correlationData.toString());

            }

        });

依旧是不安全的。
rabbitTemplate的发送流程是这样的：
1 发送数据并返回(不确认rabbitmq服务器已成功接收)
2 异步的接收从rabbitmq返回的ack确认信息
3 收到ack后调用confirmCallback函数
注意：在confirmCallback中是没有原message的，所以无法在这个函数中调用重发，confirmCallback只有一个通知的作用

在这种情况下，如果在2，3步中任何时候切断连接，我们都无法确认数据是否真的已经成功发送出去，从而造成数据丢失的问题。

最完美的解决方案只有1种：
使用rabbitmq的事务机制。
但是在这种情况下，rabbitmq的效率极低，每秒钟处理的message在几百条左右。实在不可取。
第二种解决方式，使用同步的发送机制，也就是说，客户端发送数据，rabbitmq收到后返回ack，再收到ack后，send函数才返回。代码类似这样：

创建channel

send message

wait for ack(or 超时)

close channel

返回成功or失败

同样的，由于每次发送message都要重新建立连接，效率很低。

基于上面的分析，我们使用一种新的方式来做到数据的不丢失。
在rabbitTemplate异步确认的基础上
1 在本地缓存已发送的message
2 通过confirmCallback或者被确认的ack，将被确认的message从本地删除
3 定时扫描本地的message，如果大于一定时间未被确认，则重发

当然了，这种解决方式也有一定的问题：
想象这种场景，rabbitmq接收到了消息，在发送ack确认时，网络断了，造成客户端没有收到ack，重发消息。（相比于丢失消息，重发消息要好解决的多，我们可以在consumer端做到幂等）。
自动重试的代码如下：

public class RetryCache {

    private MessageSender sender;

    private boolean stop = false;

    private Map<String, MessageWithTime> map = new ConcurrentHashMap<>();

    private AtomicLong id = new AtomicLong();

    @NoArgsConstructor

    @AllArgsConstructor

    @Data

    private static class MessageWithTime {

        long time;

        Object message;

    }

    public void setSender(MessageSender sender) {

        this.sender = sender;

        startRetry();

    }

    public String generateId() {

        return "" + id.incrementAndGet();

    }

    public void add(String id, Object message) {

        map.put(id, new MessageWithTime(System.currentTimeMillis(), message));

    }

    public void del(String id) {

        map.remove(id);

    }

    private void startRetry() {

        new Thread(() ->{

            while (!stop) {

                try {

                    Thread.sleep(Constants.RETRY_TIME_INTERVAL);

                } catch (InterruptedException e) {

                    e.printStackTrace();

                }

                long now = System.currentTimeMillis();

                for (String key : map.keySet()) {

                    MessageWithTime messageWithTime = map.get(key);

                    if (null != messageWithTime) {

                        if (messageWithTime.getTime() + 3 * Constants.VALID_TIME < now) {

                            log.info("send message failed after 3 min " + messageWithTime);

                            del(key);

                        } else if (messageWithTime.getTime() + Constants.VALID_TIME < now) {

                            DetailRes detailRes = sender.send(messageWithTime.getMessage());

                            if (detailRes.isSuccess()) {

                                del(key);

                            }

                        }

                    }

                }

            }

        }).start();

    }

}

在client端发送之前，先在本地缓存message，代码如下：

@Override

public DetailRes send(Object message) {

    try {

        String id = retryCache.generateId();

        retryCache.add(id, message);

        rabbitTemplate.correlationConvertAndSend(message, new CorrelationData(id));

    } catch (Exception e) {

        return new DetailRes(false, "");

    }

    return new DetailRes(true, "");

}

在收到ack时删除本地缓存，代码如下：

rabbitTemplate.setConfirmCallback((correlationData, ack, cause) -> {

    if (!ack) {

        log.info("send message failed: " + cause + correlationData.toString());

    } else {

        retryCache.del(correlationData.getId());

    }

});

再次验证刚才的场景，发送300w条数据，在发送的过程中过一段时间close一次connection，发送结束后，实际发送数据301.2w条，有一些重复，但是没有丢失数据。
同时需要验证本地缓存的内存泄露问题，程序连续发送1.5亿条数据，内存占用稳定在900M，并没有明显的波动。

最后贴一下rabbitmq的性能测试数据：
1 300w条1k的数据，单机部署rabbitmq(8核，32G)
在ack确认模式下平均发送效率为1.1w条/秒
非ack确认模式下平均发送效率为1.6w条/秒

2 300w条1k的数据，cluster模式部署3台(8核*3， 32G*3）
在ack确认模式下平均发送效率为1.3w条/秒
非ack确认模型下平均发送效率为1.7w条/秒

3 300w条1k的数据，单机部署rabbitmq(8核，32G)
在ack确认模式下平均消费效率为9000条/秒

4 300w条1k的数据，cluster模式部署3台(8核*3， 32G*3）
在ack确认模式下平均消费效率为1w条/秒

代码地址：

https://github.com/littlersmall/rabbitmq-access

帮忙点个星星，谢谢-_-

[转载]rabbitmq可靠发送的自动重试机制的更多相关文章

rabbitmq 不发送ack消息如何处理:rabbitmq可靠发送的自动重试机制
转载地址:http://www.jianshu.com/p/6579e48d18ae http://www.jianshu.com/p/4112d78a8753 接这篇在上文中,主要实现了可靠模式的 ...
RabbitMq手动确认时的重试机制
本文转载自RabbitMq手动确认时的重试机制消息手动确认模式的几点说明监听的方法内部必须使用channel进行消息确认,包括消费成功或消费失败如果不手动确认,也不抛出异常,消息不会自动重新推送 ...
精讲RestTemplate第8篇-请求失败自动重试机制
本文是精讲RestTemplate第8篇,前篇的blog访问地址如下: 精讲RestTemplate第1篇-在Spring或非Spring环境下如何使用精讲RestTemplate第2篇-多种底层H ...
精讲响应式WebClient第6篇-请求失败自动重试机制，强烈建议你看一看
本文是精讲响应式WebClient第6篇,前篇的blog访问地址如下: 精讲响应式webclient第1篇-响应式非阻塞IO与基础用法精讲响应式WebClient第2篇-GET请求阻塞与非阻塞调用方 ...
OkHttp3使用教程，实现get、post请求发送，自动重试，打印响应日志。
一.创建线程安全的okhttp单例 import service.NetworkIntercepter;import service.RetryIntercepter;import okhttp3.* ...
Cypress系列（6）- Cypress 的重试机制
如果想从头学起Cypress,可以看下面的系列文章哦 https://www.cnblogs.com/poloyy/category/1768839.html 前言重试(Retry-ability) ...
要做重试机制，就只能选择 DelayQueue ？其实 RabbitMQ 它上它也行！
原文链接:要做重试机制,就只能选择 DelayQueue ?其实 RabbitMQ 它上它也行! 一.场景最近研发一个新功能,后台天气预警:后台启动一条线程,定时调用天气预警 API,查询现有城市的 ...
RabbitMQ重试机制
消费端在处理消息过程中可能会报错,此时该如何重新处理消息呢?解决方案有以下两种. 在redis或者数据库中记录重试次数,达到最大重试次数以后消息进入死信队列或者其他队列,再单独针对这些消息进行处理: ...
nginx的重试机制以及nginx常用的超时配置说明
nginx的重试机制现在对外服务的网站,很少只使用一个服务节点,而是部署多台服务器,上层通过一定机制保证容错和负载均衡. nginx就是常用的一种HTTP和反向代理服务器,支持容错和负载均衡. ng ...

随机推荐

JAVA字符串编码转换常用类
无论是对程序的本地化还是国际化,都会涉及到字符编码的转换的问题.尤其在web应用中常常需要处理中文字符,这时就需要进行字符串的编码转换,将字符串编码转换为GBK或者GB2312.一.关键技术点: ...
Android客户端通过socket与服务器通信
android端--Client package com.sec.chatroomandroid; import java.io.BufferedReader; import java.io.Buff ...
python+mysql抓取百度新闻的标题存到数据库
#!usr/bin/python# -*- coding:utf-8 -*-import urllib2 import re import MySQLdb class BaiDuNews: def _ ...
mystring c++ 自己的string 封装
1 /************************************************************************* > File Name: mystrin ...
pycharm 安装venv的依赖包
(venv)$ pip install -r requirements.txt
JQuery的插件开发——重点
1.给JQuery全局对象扩展一个函数方法 $.log=function(){ /* 给全局对象$扩展一个函数*/ } $.log;//调用方法 2.给JQuery普通对象扩展一个函数方法 3.使用第 ...
Jquery实现鼠标拖拽效果
<%@ page language="java" import="java.util.*" pageEncoding="utf-8"% ...
Horizon/DomainWorkFlow
https://wiki.openstack.org/wiki/Horizon/DomainWorkFlow
package。。
如果在源代码内没有加上 package ... 是无法以下面的方式访问到主类的. D:\lab_>java timer.LambdaTest 加载时会返回 "错误: 找不到或无法加载主 ...
CentOS 6.4 x64 postfix + dovecot + 虚拟用户认证
第一, 首先必须安装 apacache mysql php CentOS 直接使用 yum 安装 yum -y install httpd httpd-devel mysql php-mysql ...

[转载]rabbitmq可靠发送的自动重试机制

[转载]rabbitmq可靠发送的自动重试机制的更多相关文章

随机推荐

热门专题