Netty4.0.24.Final 版本中 IdleStateHandler 使用时的局限性
使用Netty在客户端和服务端建立通讯通道,一般来说,一个连接可能很久没有访问,由于各种各样的网络问题导致连接已经失效,客户端再次发送请求时会产生连接异常。
基于这个原因,需要在客户端和服务端之间建立ping-pong的心跳机制,我的本意是想通过IdleStateHandler这个netty提供的工具来自动发现连接空闲状态,却出现了以下问题:
1.客户端和服务端使用 IdleStateHandler 时,原本的请求响应机制失效
2.IdleStateHandler的空闲通知功能正常,但是却不准确
最开始排查这个问题的原因是一头雾水,通过断点和分析程序已经走到哪个位置,最终确定IdleStateHandler在输出服务端的响应到channel时,出现了问题
/**
* 发送服务端的响应
* @param messageId
* @param channel
* @param messageResult
*/
protected void sendResponse(long messageId, Channel channel, Object messageResult) {
MsgHeader msgHeader = new MsgHeader(Constants.RESPONSE_MSG);
if(messageResult != null) {
msgHeader.setClz(messageResult.getClass().getName());
}else {
msgHeader.setClz(Constants.NULL_RESULT_CLASS);
} ResponseMsg responseMsg = new ResponseMsg();
responseMsg.setReceiveTime(System.currentTimeMillis());
responseMsg.setResponse(messageResult);
responseMsg.setMsgHeader(msgHeader);
responseMsg.getMsgHeader().setMsgId(messageId); //如果使用voidPromise,则无法和IdleStateHandler同时使用,因为它会触发voidPromise的addListener(...)操作,从而导致write失败
channel.writeAndFlush(responseMsg, channel.voidPromise());
}
在处理完请求进行响应输出时,最后一行在写响应时,使用了空的promise,最终会导致IdleStateHandler的write方法处获得这个空的Promise,进而导致异常
@Override
public void write(ChannelHandlerContext ctx, Object msg, ChannelPromise promise) throws Exception {
promise.addListener(new ChannelFutureListener() {
@Override
public void operationComplete(ChannelFuture future) throws Exception {
lastWriteTime = System.nanoTime();
firstWriterIdleEvent = firstAllIdleEvent = true;
}
});
ctx.write(msg, promise);
}
空的Promise的addListener实现方式是简单粗暴的抛出异常,这就导致末行的ctx.write(msg, promise)永远也不能执行到。
final class VoidChannelPromise extends AbstractFuture<Void> implements ChannelPromise {
...
@Override
public VoidChannelPromise addListener(GenericFutureListener<? extends Future<? super Void>> listener) {
fail();
return this;
}
private static void fail() {
throw new IllegalStateException("void future");
}
...
}
找到这个原因后,立即修改了Server端Handler的发送方法
/**
* 发送服务端的响应
* @param messageId
* @param channel
* @param messageResult
*/
protected void sendResponse(long messageId, Channel channel, Object messageResult) {
MsgHeader msgHeader = new MsgHeader(Constants.RESPONSE_MSG);
if(messageResult != null) {
msgHeader.setClz(messageResult.getClass().getName());
}else {
msgHeader.setClz(Constants.NULL_RESULT_CLASS);
} ResponseMsg responseMsg = new ResponseMsg();
responseMsg.setReceiveTime(System.currentTimeMillis());
responseMsg.setResponse(messageResult);
responseMsg.setMsgHeader(msgHeader);
responseMsg.getMsgHeader().setMsgId(messageId); //如果使用voidPromise,则无法和IdleStateHandler同时使用,因为它会触发voidPromise的addListener(...)操作,从而导致write失败
channel.writeAndFlush(responseMsg, channel.newPromise());
}
末行new一个默认的Promise,执行addListener不会产生异常
这样server端的问题就解决了
然后client端却无法解决这个问题,原因时client端接收响应后,netty内部会new一个VoidPromise,这就导致了IdleStateHandler放置于客户端时无论如何都不能正常使用,因为一旦触发write方法就直接异常了,目前还没有找到这两者同时存在的方案。这是Netty4.0.24.Final版本的硬伤,好在的是,Netty4的最新版本已经fix了这个问题
<dependency>
<groupId>io.netty</groupId>
<artifactId>netty-all</artifactId>
<version>4.1.12.Final</version>
</dependency>
IdleStateHandler的write方法已经对此做出了修正
@Override
public void write(ChannelHandlerContext ctx, Object msg, ChannelPromise promise) throws Exception {
// Allow writing with void promise if handler is only configured for read timeout events.
if (writerIdleTimeNanos > 0 || allIdleTimeNanos > 0) {
ChannelPromise unvoid = promise.unvoid(); //此处保证返回的一定是非void的
unvoid.addListener(writeListener);
ctx.write(msg, unvoid);
} else {
ctx.write(msg, promise);
}
}
总结,一个复杂的框架无论如何会有一些毛病,就像业务系统中的一个bug,两个东西不是同一个人开发的,就会出现使用时的异常情况,找到这个原因进行分析,解决的思路也就跃然于纸上。
最终,我把netty4的版本升级到了最新的4.1.12.Final,防止更多这样的问题产生。
Netty4.0.24.Final 版本中 IdleStateHandler 使用时的局限性的更多相关文章
- OpenGL2.0及以上版本中glm,glut,glew,glfw,mesa等部件的关系
OpenGL2.0及以上版本中gl,glut,glew,glfw,mesa等部件的关系 一.OpenGL OpenGL函数库相关的API有核心库(gl),实用库(glu),辅助库(aux).实用工具库 ...
- getContext在谷歌浏览器中,使用时要先加载canvas对象,否则会提示'getContext is null'
<body> <canvas id=" style="border:1px solid #c3c3c3;"> Your browser does ...
- 关于电脑安装多个版本JDK后使用时的切换
描述:刚到新公司,自己安装了jdk1.7和开发工具myeclipse10,但是由于公司项目的需要(具体原因不详细描述了),需要使用myeclipse6.5和jdk1.6.于是在切换jdk1.7和jdk ...
- Lua-面向对象中函数使用时冒号(:)和点(.)的区别
先来看一段简单的代码: local Animal = {} function Animal:Eat( food ) print("Animal:Eat", self, food) ...
- vue中keep-alive使用时,注意要点
<keep-alive exclude="QRCode,NewsInfor,VipRecordDetail"> <router-view></rout ...
- Hibernate/JPA中@Where使用时注意
在使用Hibernate或者JPA时,我们经常会使用@Where注解实现查询过滤,在实体类上.实体属性上.查询语句上都有应用. 例如: @Where(clause = "status != ...
- OptaPlanner 7.32.0.Final版本彩蛋 - SolverManager之异步求解
因为工作和其它原因,很长一段时间没有出新的.关于OptaPlanner的文章了,但工余时间并没有停止对该引擎的学习.与此同时Geoffrey大神带领的KIE项目团队并没有闲下来,尽管在工业可用性.易用 ...
- OptaPlanner 7.32.0.Final版本彩蛋 - SolverManager之批量求解
上一篇介绍了OptaPlanner 7.32.0.Final版本中的SolverManager接口可以实现异步求解功能.本篇将继续介绍SolverManager的另一大特性 - 批量求解. 适用场景 ...
- android圆角View实现及不同版本这间的兼容(android3.0过后的版本)
http://blog.csdn.net/lovecluo/article/details/8710174 在做我们自己的APP的时候,为了让APP看起来更加的好看,我们就需要将我们的自己的View做 ...
随机推荐
- hadoop2的mapreduce操作hbase数据
1.从hbase中取数据,再把计算结果插入hbase中 package com.yeliang; import java.io.IOException; import org.apache.hadoo ...
- js判断值为null
今天在做项目的时候,犯了一个着实不应该的错误,拿到data为null,然后判断如果为null执行A,否则执行B 我错误的代码是 if(data===null){ A; }else{ B; } 怎么调试 ...
- Windows环境下多线程编程原理与应用读书笔记(1)————基本概念
自从学了操作系统知识后,我就对多线程比较感兴趣,总想让自己写一些有关多线程的程序代码,但一直以来,发现自己都没怎么好好的去全面学习这方面的知识,仅仅是完成了操作系统课程上的小程序,对多线程的理解也不是 ...
- Description has only two Sentences(欧拉定理 +快速幂+分解质因数)
Description has only two Sentences Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 65536/32768 ...
- Android 开发笔记___SQLite__基本用法
SQLiteOpenHelper package com.example.alimjan.hello_world.dataBase; import android.content.ContentVal ...
- Node.js Stream(流)
Stream 是一个抽象接口,Node 中有很多对象实现了这个接口.例如,对http 服务器发起请求的request 对象就是一个 Stream,还有stdout(标准输出). Node.js,Str ...
- Android打开/data/目录以及导出文件
打开logcat和和file Explorer Tools-->Android-->Android Device Monitor 如果右侧没有出现,Windows-->Show Vi ...
- redis源码分析之事务Transaction(上)
这周学习了一下redis事务功能的实现原理,本来是想用一篇文章进行总结的,写完以后发现这块内容比较多,而且多个命令之间又互相依赖,放在一篇文章里一方面篇幅会比较大,另一方面文章组织结构会比较乱,不容易 ...
- C#获取指定月指定周的日期范围
); MessageBox.Show(end.ToShortDateString());
- RabbitMQ之工作队列
工作队列 工作队列(又称:任务队列Task Queues)是为了避免等待一些占用大量资源.时间的操作,当我们把任务Task当做消息发送队列中,一个运行在后台的工作者worker进程就会取出任务然后处理 ...