1、先说问题

背景:服务是运行在Linux上的安全网关提供的,TCP协议发送 通过二进制编码的xml字符串 报文,报文头的第一个字段是int类型的表示字节序标记,第二个字段是int类型的表示整个报文长度。

现象:数据量较小时完全可以正常收发报文,当服务端发送的报文数据量较大时(本例是将近600k)概率性出现接收数据直接调用readComplete()方法而没有走channelRead()

跟踪:跟踪代码发现出问题时context 的 read() 方法执行中读取到一百多k(有时两百多也可能三百多,总之是还没读取到全部数据)时某次读到的数据本应该是1024字节(填满默认分配的ByteBuf)却只读到了576字节;

netty框架代码中判断如果当前读到的字节数小于ByteBuf的size则认为是读取完成,因此调用了readComplete()方法,出错。。。

解决方案:在ClientHandler类添加一个标记flag,用于是否正常读取数据判断。channelRead()方法正常调用则将其置为true;readComplete方法中添加一个判断只有当flag为true时关闭context否则继续调用ctx.read()。

2、再上核心代码

Client:

 ClientHandler clientHandler = new ClientHandler(this);
bootstrap.group(eventLoop)
.channel(NioSocketChannel.class)
.option(ChannelOption.TCP_NODELAY, true)
.option(ChannelOption.CONNECT_TIMEOUT_MILLIS, 3000)
.option(ChannelOption.MAX_MESSAGES_PER_READ, Integer.MAX_VALUE)
.handler(new ClientChannelInitializer(clientHandler)); ChannelFuture f = bootstrap.connect(host, port).sync(); f.channel().closeFuture().sync();
 private class ClientChannelInitializer extends ChannelInitializer<SocketChannel> {
private ClientHandler clientHandler; public ClientChannelInitializer(ClientHandler clientHandler) {
this.clientHandler = clientHandler;
} @Override
protected void initChannel(SocketChannel socketChannel) throws Exception { socketChannel.pipeline().addLast(new SplDecoder());
socketChannel.pipeline().addLast(clientHandler);
channel = socketChannel;
}
}
// 解决问题前 initChannel的实现是这样的,使用了netty内部的长度字段解码器
@Override
protected void initChannel(SocketChannel ch) throws Exception {
ch.pipeline().addLast(new LengthFieldBasedFrameDecoder(Integer.MAX_VALUE,4,4,-8,0));
ch.pipeline().addLast(clientHandler);
}

ClientHandler:

public class ClientHandler extends ChannelInboundHandlerAdapter {
 @Override
public void channelActive(ChannelHandlerContext context) throws Exception {
logger.info("Ready to send request...");
ByteBuffer result = getByteBuffer();
ByteBuf buf = Unpooled.buffer(result.remaining());
buf.writeBytes(result); context.writeAndFlush(buf);
} @Override
public void channelRead(ChannelHandlerContext context, Object msg) throws Exception {
logger.info("Get server response..."); String[] result = (String[]) msg; logger.debug("response xml is : " + result[1]);
client.setResponse(result); ok = true;
} @Override
public void channelReadComplete(ChannelHandlerContext ctx) throws Exception {
ctx.flush();
if (ok) {
ctx.close();
} else {
ctx.read();
}
}

3、最后说解决过程

起初我怀疑是使用netty的定长字段解码器LengthFieldBasedFrameDecoder参数不当引起的,因为自认为对它理解不深;于是自己写了一个继承byteToMessageDecoder的解码器可以实现解决拆包问题和解码功能,但是问题依然概率性出现...

后来抱着试试看的态度在ClientHandler里面添加了一个实例属性ok(默认false),在正常执行channelRead()方法后将其置为true,readComplete()方法中做判断如果ok==false调用ctx.read(),运行发现完美解决问题

因为调用read()方法是继续读取数据而不是重新读取(因为此时ctx和channel、pipline等数据状态都没变)!

在SplDecoder类中添加当前读取数据打印信息:“logger.debug("读取数据:本次" + readableBytes + ";累计" + currentLength + ";总共" + total);”;

在ctx.read()前面添加打印错误信息“****** 读取数据不完整,再次读取......”

运行正常和出错时的控制台打印信息如下(由于实际打印行数太多,我用"......"代替了部分重复行):

 Connected to the target VM, address: '127.0.0.1:62194', transport: 'socket'
log4j:WARN No appenders could be found for logger (io.netty.util.internal.logging.InternalLoggerFactory).
log4j:WARN Please initialize the log4j system properly.
读取数据:本次1024;累计1024;总共574842
读取数据:本次1024;累计2048;总共574842
读取数据:本次1024;累计3072;总共574842
......
读取数据:本次1024;累计572416;总共574842
读取数据:本次1024;累计573440;总共574842
读取数据:本次1024;累计574464;总共574842
读取数据:本次378;累计574842;总共574842
0 ~~ null
Disconnected from the target VM, address: '127.0.0.1:62194', transport: 'socket' Process finished with exit code 0

正常时结果

 Connected to the target VM, address: '127.0.0.1:62068', transport: 'socket'
log4j:WARN No appenders could be found for logger (io.netty.util.internal.logging.InternalLoggerFactory).
log4j:WARN Please initialize the log4j system properly.
读取数据:本次1024;累计1024;总共574842
读取数据:本次1024;累计2048;总共574842
读取数据:本次1024;累计3072;总共574842
读取数据:本次1024;累计4096;总共574842
读取数据:本次1024;累计5120;总共574842
读取数据:本次1024;累计6144;总共574842
读取数据:本次1024;累计7168;总共574842
读取数据:本次1024;累计8192;总共574842
读取数据:本次1024;累计9216;总共574842
读取数据:本次1024;累计10240;总共574842
读取数据:本次1024;累计11264;总共574842
读取数据:本次1024;累计12288;总共574842
读取数据:本次1024;累计13312;总共574842
读取数据:本次576;累计13888;总共574842
****** 读取数据不完整,再次读取......
读取数据:本次16384;累计30272;总共574842
读取数据:本次16384;累计46656;总共574842
读取数据:本次16384;累计63040;总共574842
......
读取数据:本次16384;累计554560;总共574842
读取数据:本次16384;累计570944;总共574842
读取数据:本次3898;累计574842;总共574842
0 ~~ null
Disconnected from the target VM, address: '127.0.0.1:62068', transport: 'socket' Process finished with exit code 0

出错时结果

结果最后打印0~~null表示正常结束(返回code为0错误信息为null)。

附:

问题处理前控制台打印结果

 "C:\Program Files...
log4j:WARN No appenders could be found for logger (io.netty.util.internal.logging.InternalLoggerFactory).
log4j:WARN Please initialize the log4j system properly.
-1 ~~ 服务异常;Detail:java.lang.NullPointerException Process finished with exit code 0

问题处理前控制台打印信息

由于没有执行channelRead()方法,所以我获取到的数据没能执行赋值操作,报了空指针异常。

结果最后打印 -1 ~~ 服务异常;Detail:java.lang.NullPointerException 表示发生了异常(返回code为-1;错误信息为"服务异常;Detail:java.lang.NullPointerException")

使用netty4.x客户端接收较大数据量报文时发生的读取不完整bug修复记录的更多相关文章

  1. 大数据量传输时配置WCF的注意事项

    原文:大数据量传输时配置WCF的注意事项 WCF传输数据量的能力受到许多因素的制约,如果程序中出现因需要传输的数据量较大而导致调用WCF服务失败的问题,应注意以下配置: 1.MaxReceivedMe ...

  2. 【转载】大数据量传输时配置WCF的注意事项

    WCF传输数据量的能力受到许多因素的制约,如果程序中出现因需要传输的数据量较大而导致调用WCF服务失败的问题,应注意以下配置: 1.MaxReceivedMessageSize:获取或设置配置了此绑定 ...

  3. hadoop job解决大数据量关联时数据倾斜的一种办法

    转自:http://www.cnblogs.com/xuxm2007/archive/2011/09/01/2161929.html http://www.geminikwok.com/2011/04 ...

  4. java处理大数据量任务时的可用思路--未验证版,具体实现方法有待实践

    1.Bloom filter适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集基本原理及要点:对于原理来说很简单,位数组+k个独立hash函数.将hash函数对应的值的位数组置1,查找时如 ...

  5. 关于webservice大数据量传输时的压缩和解压缩

    当访问WebSerivice时,如果数据量很大,传输数据时就会很慢.为了提高速度,我们就会想到对数据进行压缩.首先我们来分析一下. 当在webserice中传输数据时,一般都采用Dataset进行数据 ...

  6. VC++大数据量绘图时无闪烁刷屏技术实现(我的理解是,在内存上作画,然后手动显示,而不再直接需要经过WM_PAINT来处理了)

    http://hantayi.blog.51cto.com/1100843/383578 引言 当我们需要在用户区显示一些图形时,先把图形在客户区画上,虽然已经画好但此时我们还无法看到,还要通过 程序 ...

  7. 使用内存映射文件MMF实现大数据量导出时的内存优化

    前言 导出功能几乎是所有应用系统必不可少功能,今天我们来谈一谈,如何使用内存映射文件MMF进行内存优化,本文重点介绍使用方法,相关原理可以参考文末的连接 实现 我们以单次导出一个excel举例(csv ...

  8. c# 大数据量比较时-方案

    1.当面临千万条数据量的比较时,从技术的角度来说应该用泛型键值(c#键值由于用了散列算法速度很快).例如前几天我需要查的是 航空公司.出发.到达.返点可以将 航空公司-出发-到达做一个键,返点作为值. ...

  9. 大数据量冲击下Windows网卡异常分析定位

    背景 mqtt的服务端ActiveMQ在windows上,多台PC机客户端不停地向MQ发送消息. 现象 观察MQ自己的日志data/activemq.log里显示,TCP链接皆异常断开.此时尝试从服务 ...

随机推荐

  1. Linux下解压命令大全 解压缩 tar bz2 zip tar.gz gz

    .tar解包:tar xvf FileName.tar打包:tar cvf FileName.tar DirName(注:tar是打包,不是压缩!)---------------.gz解压1:gunz ...

  2. Stripe开发笔记之-ISO Currency Code(ISO 4217)

    参考:维基百科和ISO官网 ISO Currency Code:国际标准组织通用货币代号,国际标准化组织(英语:International Organization for Standardizati ...

  3. iOS超全开源框架、项目和学习资料汇总(5)AppleWatch、经典博客、三方开源总结篇

    完整项目 v2ex – v2ex 的客户端,新闻.论坛.apps-ios-wikipedia – apps-ios-wikipedia 客户端.jetstream-ios – 一款 Uber 的 MV ...

  4. kafka windows环境搭建 测试

    http://www.cnblogs.com/alvingofast/p/kafka_deployment_on_windows.html 照着例子搭建成功

  5. Android 强烈推荐:程序员接私活那点事

    今天周末在家宅着,并不是我不想运动,是因为北京的雨雪交加导致我想在家写文章,不过想想给大家写文章还是蛮惬意的,望一眼窗外,看一眼雪景,指尖在键盘上跳动,瞬间有种从屌丝程序员转变成了小姑娘们都羡慕的文艺 ...

  6. win10没有新建文件夹

    win10没有新建文件夹 win10系统,电脑点击右键没有新建文件夹选项. 工具/原料   win10 系统台式机 方法/步骤     电脑左下角搜素出输入:cmd   出现以下画面   在命令指示符 ...

  7. Java c3p0连接池

    import java.beans.PropertyVetoException; import java.sql.Connection; import java.sql.SQLException; i ...

  8. iOS,应用崩溃日志分析

    参考资料:http://www.cocoachina.com/industry/20130725/6677.html 1.获得崩溃日志 2.崩溃日志实例 3.符号化崩溃日志 4.低内存闪退 获得崩溃日 ...

  9. STM32 assert_param

    在STM32的固件库和提供的例程中,到处都可以见到assert_param()的使用.如果打开任何一个例程中的stm32f10x_conf.h文件,就可以看到实际上assert_param是一个宏定义 ...

  10. matlab中patch函数的用法

    http://blog.sina.com.cn/s/blog_707b64550100z1nz.html matlab中patch函数的用法——emily (2011-11-18 17:20:33) ...