Flink 消费RabbitMQ 和 Kafka

在消息RabbitMQ时,我们关心的一个问题是手动ack还是自动ack,如果是自动ack就怕出现丢消息的情况

Flink以RabbitMQ作为Source,是怎么保证消息唯一性的呢,是怎么保证ack的.

首先引入依赖包

<dependency>

     <groupId>org.apache.flink</groupId>

     <artifactId>flink-connector-kafka-0.10_${scala.version}</artifactId>

     <version>${flink.version}</version>

</dependency>

RMQSource类,可以看到如果设置了checkpointing,则默认autoAck是false,是手动控制提交的
那什么时候提交呢,flink checkpointing有个时间间隔,每次checkpointing触发时,才能ack,也就是说,不是一条消息ack一下,而是定时ack
这个跟kafka,update offset一样,都是在checkpoint的时候处理

@Override

	public void open(Configuration config) throws Exception {

		super.open(config);

		ConnectionFactory factory = setupConnectionFactory();

		try {

			connection = factory.newConnection();

			channel = connection.createChannel();

			if (channel == null) {

				throw new RuntimeException("None of RabbitMQ channels are available");

			}

			setupQueue();

			consumer = new QueueingConsumer(channel);

			RuntimeContext runtimeContext = getRuntimeContext();

			if (runtimeContext instanceof StreamingRuntimeContext

					&& ((StreamingRuntimeContext) runtimeContext).isCheckpointingEnabled()) {

				autoAck = false;

				// enables transaction mode

				channel.txSelect();

			} else {

				autoAck = true;

			}

			LOG.debug("Starting RabbitMQ source with autoAck status: " + autoAck);

			channel.basicConsume(queueName, autoAck, consumer);

		} catch (IOException e) {

			throw new RuntimeException("Cannot create RMQ connection with " + queueName + " at "

					+ rmqConnectionConfig.getHost(), e);

		}

		running = true;

	}

RMQSource

@Override

	public void run(SourceContext<OUT> ctx) throws Exception {

		while (running) {

			QueueingConsumer.Delivery delivery = consumer.nextDelivery();

			synchronized (ctx.getCheckpointLock()) {

				OUT result = schema.deserialize(delivery.getBody());

				if (schema.isEndOfStream(result)) {

					break;

				}

				if (!autoAck) {

					final long deliveryTag = delivery.getEnvelope().getDeliveryTag();

					if (usesCorrelationId) {

						final String correlationId = delivery.getProperties().getCorrelationId();

						Preconditions.checkNotNull(correlationId, "RabbitMQ source was instantiated " +

							"with usesCorrelationId set to true but a message was received with " +

							"correlation id set to null!");

						if (!addId(correlationId)) {

							// we have already processed this message

							continue;

						}

					}

					sessionIds.add(deliveryTag);

				}

				ctx.collect(result);

			}

		}

	}

@Override

	protected void acknowledgeSessionIDs(List<Long> sessionIds) {

		try {

			for (long id : sessionIds) {

				channel.basicAck(id, false);

			}

			channel.txCommit();

		} catch (IOException e) {

			throw new RuntimeException("Messages could not be acknowledged during checkpoint creation.", e);

		}

	}

Flink 消费RabbitMQ 和 Kafka的更多相关文章

Flink消费Kafka数据并把实时计算的结果导入到Redis
1. 完成的场景在很多大数据场景下,要求数据形成数据流的形式进行计算和存储.上篇博客介绍了Flink消费Kafka数据实现Wordcount计算,这篇博客需要完成的是将实时计算的结果写到redis. ...
Flink消费Kafka到HDFS实现及详解
1.概述最近有同学留言咨询,Flink消费Kafka的一些问题,今天笔者将用一个小案例来为大家介绍如何将Kafka中的数据,通过Flink任务来消费并存储到HDFS上. 2.内容这里举个消费Kaf ...
Flink消费kafka
Flink消费Kafka https://blog.csdn.net/boling_cavalry/article/details/85549434 https://www.cnblogs.com/s ...
RabbitMQ和Kafka
转自通九大神的博客起因最近公司RabbitMQ的集群出了点问题,然后有些亲就说RabbitMQ慢且不好用,是一个瓶颈,不如换成Kafka.而我本人,使用RabbitMQ有一点久了,认为这个事情应当 ...
RabbitMQ和Kafka到底怎么选（二）？
前言前一篇文章<RabbitMQ和Kafka到底怎么选?>,我们在吞吐量方面比较了Kafka和RabbitMQ,知道了Kafka的吞吐量要高于RabbitMQ.本文从可靠性方面继续探讨两 ...
RabbitMQ和Kafka到底怎么选？
前言开源社区有好多优秀的队列中间件,比如RabbitMQ和Kafka,每个队列都貌似有其特性,在进行工程选择时,往往眼花缭乱,不知所措.对于RabbitMQ和Kafka,到底应该选哪个? Rabbi ...
RabbitMQ 和 Kafka
============================RabbitMQ 术语============================RabbitMQ 有很多术语和Kafka不一样, 理解这些术语十分 ...
关于ActiveMQ、RocketMQ、RabbitMQ、Kafka一些总结和区别
这是一篇分享文转自:http://www.cnblogs.com/williamjie/p/9481780.html 尊重原作,谢谢消息队列为什么写这篇文章? 博主有两位朋友分别是小A和小B: ...
RabbitMQ和Kafka对比以及场景使用说明
我目前的项目最后使用的是RabbitMQ,这里依然是结合网上大神们的优秀博客,对kafka和rabbitmq进行简单的比对.最后附上参考博客. 1.架构模型 rabbitmq RabbitMQ遵循AM ...
RabbitMQ和Kafka,更加便捷高效的消息队列使用方式，请放心食用
一.RabbitMQ实例介绍RabbitMQ实例由华为云分布式消息服务(DMS)团队打造,实例采用物理隔离的方式部署,租户独占RabbitMQ实例.一键式部署,完全兼容开源RabbitMQ的使用方式, ...

随机推荐

js/jquery 所有页面点击事件(持续更新)
// 切换菜单 <div class="box"> <div class="box-item" id=" ...
java环境变量(Windows 11)
1.下载JDK,之后安装建议安装java8或者java11,稳定,大家都在用下载网址:https://www.oracle.com/java/technologies/downloads/#jav ...
listview自定义适配器
class FruitAdapter(activity: Activity ,val id:Int,data:List<Fruit>):ArrayAdapter<Fruit>( ...
编程基础与python介绍
思维导图 https://gitee.com/starry-tong/python-data/blob/pyimage/day02.png 1.计算机内部存储数据的原理 2.编程语言的发展史 3.py ...
Truenas core 13连接LDAP，获取AD域用户及自动分配权限---chatGPT回复，未做证实
要在TrueNAS Core 13上连接LDAP并从AD域中获取用户,请按照以下步骤操作: 在TrueNAS Core 13上登录到WebUI. 转到"网络"菜单并选择" ...
c++获取类型信息
获取类型信息 typeid typeid运算符用来获取一个表达式的类型信息. 对于基本类型数据, 类型信息比较简单, 主要指数据的类型; 对于对象(类类型的数据), 类型信息指: 对象所属的类, 所包 ...
python 多进程和异步io的有机结合 Error in atexit._run_exitfuncs
众所周知,python的多线程开发在GIL(全局器解释锁)下饱受诟病,在单核模式下搞多线程对效率的提升相当有限.于是大家的共识就是搞io密集的程序,建议采用多线程,计算密集型的程序就搞多进程.近期的一 ...
[BOM] 封装一下cookie
function get_cookie(key) { var arr, reg = new RegExp("(^| )" + key + "=([^;]*)(;|$)&q ...
九、Lambda、正则表达式
Lambda表达式只能简化函数式接口的匿名内部类!!!函数式接口:有且仅有一个抽象方法的接口.有@FunctionalInterface的注解的接口就必定是函数式接口. 正则表达式单字符类预定义 ...
word和excel转pdf
1.下载jacob.jar包网址:https://sourceforge.net/projects/jacob-project/files/jacob-project/ 2.导入到本地仓库:mvn ...

Flink 消费RabbitMQ 和 Kafka

Flink 消费RabbitMQ 和 Kafka的更多相关文章

随机推荐

热门专题