使用netty4.x客户端接收较大数据量报文时发生的读取不完整bug修复记录

1、先说问题

背景：服务是运行在Linux上的安全网关提供的，TCP协议发送通过二进制编码的xml字符串报文，报文头的第一个字段是int类型的表示字节序标记，第二个字段是int类型的表示整个报文长度。

现象：数据量较小时完全可以正常收发报文，当服务端发送的报文数据量较大时(本例是将近600k)概率性出现接收数据直接调用readComplete()方法而没有走channelRead()

跟踪：跟踪代码发现出问题时context 的 read() 方法执行中读取到一百多k(有时两百多也可能三百多，总之是还没读取到全部数据)时某次读到的数据本应该是1024字节(填满默认分配的ByteBuf)却只读到了576字节；

netty框架代码中判断如果当前读到的字节数小于ByteBuf的size则认为是读取完成，因此调用了readComplete()方法，出错。。。

解决方案：在ClientHandler类添加一个标记flag，用于是否正常读取数据判断。channelRead()方法正常调用则将其置为true；readComplete方法中添加一个判断只有当flag为true时关闭context否则继续调用ctx.read()。

2、再上核心代码

Client：

 ClientHandler clientHandler = new ClientHandler(this);

             bootstrap.group(eventLoop)

                     .channel(NioSocketChannel.class)

                     .option(ChannelOption.TCP_NODELAY, true)

                     .option(ChannelOption.CONNECT_TIMEOUT_MILLIS, 3000)

                     .option(ChannelOption.MAX_MESSAGES_PER_READ, Integer.MAX_VALUE)

                     .handler(new ClientChannelInitializer(clientHandler));

             ChannelFuture f = bootstrap.connect(host, port).sync();

             f.channel().closeFuture().sync();

 private class ClientChannelInitializer extends ChannelInitializer<SocketChannel> {

         private ClientHandler clientHandler;

         public ClientChannelInitializer(ClientHandler clientHandler) {

             this.clientHandler = clientHandler;

         }

         @Override

         protected void initChannel(SocketChannel socketChannel) throws Exception {

             socketChannel.pipeline().addLast(new SplDecoder());

             socketChannel.pipeline().addLast(clientHandler);

             channel = socketChannel;

         }

     }

// 解决问题前 initChannel的实现是这样的，使用了netty内部的长度字段解码器
@Override

protected void initChannel(SocketChannel ch) throws Exception {

    ch.pipeline().addLast(new LengthFieldBasedFrameDecoder(Integer.MAX_VALUE,4,4,-8,0));

    ch.pipeline().addLast(clientHandler);

}

ClientHandler：

public class ClientHandler extends ChannelInboundHandlerAdapter {

 @Override

     public void channelActive(ChannelHandlerContext context) throws Exception {

         logger.info("Ready to send request...");

         ByteBuffer result = getByteBuffer();

         ByteBuf buf = Unpooled.buffer(result.remaining());

         buf.writeBytes(result);

         context.writeAndFlush(buf);

     }

     @Override

     public void channelRead(ChannelHandlerContext context, Object msg) throws Exception {

         logger.info("Get server response...");

         String[] result = (String[]) msg;

         logger.debug("response xml is : " + result[1]);

         client.setResponse(result);

         ok = true;

     }

     @Override

     public void channelReadComplete(ChannelHandlerContext ctx) throws Exception {

         ctx.flush();

         if (ok) {

             ctx.close();

         } else {

             ctx.read();

         }

     }

3、最后说解决过程

起初我怀疑是使用netty的定长字段解码器LengthFieldBasedFrameDecoder参数不当引起的，因为自认为对它理解不深；于是自己写了一个继承byteToMessageDecoder的解码器可以实现解决拆包问题和解码功能，但是问题依然概率性出现...

后来抱着试试看的态度在ClientHandler里面添加了一个实例属性ok(默认false)，在正常执行channelRead()方法后将其置为true，readComplete()方法中做判断如果ok==false调用ctx.read()，运行发现完美解决问题

因为调用read()方法是继续读取数据而不是重新读取(因为此时ctx和channel、pipline等数据状态都没变)！

在SplDecoder类中添加当前读取数据打印信息：“logger.debug("读取数据：本次" + readableBytes + "；累计" + currentLength + "；总共" + total);”；

在ctx.read()前面添加打印错误信息“****** 读取数据不完整，再次读取......”

运行正常和出错时的控制台打印信息如下(由于实际打印行数太多，我用"......"代替了部分重复行)：

 Connected to the target VM, address: '127.0.0.1:62194', transport: 'socket'

 log4j:WARN No appenders could be found for logger (io.netty.util.internal.logging.InternalLoggerFactory).

 log4j:WARN Please initialize the log4j system properly.

 读取数据：本次1024；累计1024；总共574842

 读取数据：本次1024；累计2048；总共574842

 读取数据：本次1024；累计3072；总共574842

 ......

 读取数据：本次1024；累计572416；总共574842

 读取数据：本次1024；累计573440；总共574842

 读取数据：本次1024；累计574464；总共574842

 读取数据：本次378；累计574842；总共574842

 0 ~~ null

 Disconnected from the target VM, address: '127.0.0.1:62194', transport: 'socket'

 Process finished with exit code 0

正常时结果

 Connected to the target VM, address: '127.0.0.1:62068', transport: 'socket'

 log4j:WARN No appenders could be found for logger (io.netty.util.internal.logging.InternalLoggerFactory).

 log4j:WARN Please initialize the log4j system properly.

 读取数据：本次1024；累计1024；总共574842

 读取数据：本次1024；累计2048；总共574842

 读取数据：本次1024；累计3072；总共574842

 读取数据：本次1024；累计4096；总共574842

 读取数据：本次1024；累计5120；总共574842

 读取数据：本次1024；累计6144；总共574842

 读取数据：本次1024；累计7168；总共574842

 读取数据：本次1024；累计8192；总共574842

 读取数据：本次1024；累计9216；总共574842

 读取数据：本次1024；累计10240；总共574842

 读取数据：本次1024；累计11264；总共574842

 读取数据：本次1024；累计12288；总共574842

 读取数据：本次1024；累计13312；总共574842

 读取数据：本次576；累计13888；总共574842

 ****** 读取数据不完整，再次读取......

 读取数据：本次16384；累计30272；总共574842

 读取数据：本次16384；累计46656；总共574842

 读取数据：本次16384；累计63040；总共574842

 ......

 读取数据：本次16384；累计554560；总共574842

 读取数据：本次16384；累计570944；总共574842

 读取数据：本次3898；累计574842；总共574842

 0 ~~ null

 Disconnected from the target VM, address: '127.0.0.1:62068', transport: 'socket'

 Process finished with exit code 0

出错时结果

结果最后打印0~~null表示正常结束(返回code为0错误信息为null)。

附：

问题处理前控制台打印结果

 "C:\Program Files...

 log4j:WARN No appenders could be found for logger (io.netty.util.internal.logging.InternalLoggerFactory).

 log4j:WARN Please initialize the log4j system properly.

 -1 ~~ 服务异常；Detail:java.lang.NullPointerException

 Process finished with exit code 0

问题处理前控制台打印信息

由于没有执行channelRead()方法，所以我获取到的数据没能执行赋值操作，报了空指针异常。

结果最后打印 -1 ~~ 服务异常；Detail:java.lang.NullPointerException 表示发生了异常(返回code为-1；错误信息为"服务异常；Detail:java.lang.NullPointerException")。

使用netty4.x客户端接收较大数据量报文时发生的读取不完整bug修复记录的更多相关文章

大数据量传输时配置WCF的注意事项
原文:大数据量传输时配置WCF的注意事项 WCF传输数据量的能力受到许多因素的制约,如果程序中出现因需要传输的数据量较大而导致调用WCF服务失败的问题,应注意以下配置: 1.MaxReceivedMe ...
【转载】大数据量传输时配置WCF的注意事项
WCF传输数据量的能力受到许多因素的制约,如果程序中出现因需要传输的数据量较大而导致调用WCF服务失败的问题,应注意以下配置: 1.MaxReceivedMessageSize:获取或设置配置了此绑定 ...
hadoop job解决大数据量关联时数据倾斜的一种办法
转自:http://www.cnblogs.com/xuxm2007/archive/2011/09/01/2161929.html http://www.geminikwok.com/2011/04 ...
java处理大数据量任务时的可用思路--未验证版，具体实现方法有待实践
1.Bloom filter适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集基本原理及要点:对于原理来说很简单,位数组+k个独立hash函数.将hash函数对应的值的位数组置1,查找时如 ...
关于webservice大数据量传输时的压缩和解压缩
当访问WebSerivice时,如果数据量很大,传输数据时就会很慢.为了提高速度,我们就会想到对数据进行压缩.首先我们来分析一下. 当在webserice中传输数据时,一般都采用Dataset进行数据 ...
VC++大数据量绘图时无闪烁刷屏技术实现（我的理解是，在内存上作画，然后手动显示，而不再直接需要经过WM_PAINT来处理了）
http://hantayi.blog.51cto.com/1100843/383578 引言当我们需要在用户区显示一些图形时,先把图形在客户区画上,虽然已经画好但此时我们还无法看到,还要通过程序 ...
使用内存映射文件MMF实现大数据量导出时的内存优化
前言导出功能几乎是所有应用系统必不可少功能,今天我们来谈一谈,如何使用内存映射文件MMF进行内存优化,本文重点介绍使用方法,相关原理可以参考文末的连接实现我们以单次导出一个excel举例(csv ...
c# 大数据量比较时-方案
1.当面临千万条数据量的比较时,从技术的角度来说应该用泛型键值(c#键值由于用了散列算法速度很快).例如前几天我需要查的是航空公司.出发.到达.返点可以将航空公司-出发-到达做一个键,返点作为值. ...
大数据量冲击下Windows网卡异常分析定位
背景 mqtt的服务端ActiveMQ在windows上,多台PC机客户端不停地向MQ发送消息. 现象观察MQ自己的日志data/activemq.log里显示,TCP链接皆异常断开.此时尝试从服务 ...

随机推荐

VS2010中，无法嵌入互操作类型“……”，请改用适用的接口的解决方法(转自网络)
最近开始使用VS2010,在引用COM组件的时候,出现了无法嵌入互操作类型“……”,请改用适用的接口的错误提示.查阅资料,找到解决方案,记录如下: 选中项目中引入的dll,鼠标右键,选择属性,把“嵌入 ...
H5+微信支付报-1问题
1.检查发起支付的参数,全部设置为小写: WxPayData jsApiParam = new WxPayData(); jsApiParam.SetValue("appid", ...
linq group by多个字段,返回多个字段.
直接上例子.var wflist = from u in db.TWelFare where u.fy_no == fy_no orderby u.we_no group u by new { wen ...
Servlet的历史与规范
http://blog.csdn.net/u010297957/article/details/51498018
https://yq.aliyun.com/articles/65125?spm=5176.100240.searchblog.18.afqQoU
https://yq.aliyun.com/articles/65125?spm=5176.100240.searchblog.18.afqQoU
DOS基础命令
对服务(service)的操作命令功能 Net start 查看Windows开启的服务 Net stop [service name] 停止服务 net start [service name] ...
如何启动redis
直接运行redis-server既可以启动redis
iOS - NSString去掉回车与换行符
代码展示: 由于服务器返回的字符串有回车与/n自己设置的xib的label显示装不下了,所以初次下策也没通知服务端自己改一下吧. NSString *str = fault.fault_content ...
Android 广播 BroadcastReceiver
Android 系统里定义了各种各样的广播,如电池的使用状态,电话的接收和短信的接收,开机启动都会产生一个广播.当然用户也可以自定义自己的广播. 既然说到广播,那么必定有一个广播发送者,以及广播接收器 ...
JavaWeb-springMVC
<context:component-scan/> 扫描指定的包中的类上的注解,常用的注解有: @Controller 声明Action组件@Service 声明Service组件 ...

使用netty4.x客户端接收较大数据量报文时发生的读取不完整bug修复记录

使用netty4.x客户端接收较大数据量报文时发生的读取不完整bug修复记录的更多相关文章

随机推荐

热门专题