疯狂创客圈,一个Java 高并发研习社群 【博客园 总入口

疯狂创客圈,倾力推出: 《Netty Zookeeper Redis 高并发实战》一书, 面试必备 + 面试必备 + 面试必备


写在前面

​ 大家好,我是作者尼恩。目前和几个小伙伴一起,组织了一个高并发的实战社群【疯狂创客圈】。正在开始高并发、亿级流程的 IM 聊天程序 学习和实战

有的小伙伴对帧解码器FrameDecoder ,尤其是LengthFieldBasedFrameDecoder(自定义长度帧解码器) 不是太了解,尤其是觉得LengthFieldBasedFrameDecoder 参数多,不理解。

这里单独撰文,对LengthFieldBasedFrameDecoder 的参数,进行重点介绍。看完之后,就会彻底的了解了。

1.1.1. 解码器:FrameDecoder

前面所讲的解码器,在获取入站数据时,都是通过ByteBuf的基础类型读取方法,读取到是基础的数据类型,比如int整数。如果在解码时,读取的不是基础类型,而是非常基础的二进制数据,该如何处理呢?

大家都知道,TCP协议是个“流”性质协议,它的底层根据二进制缓冲区的实际情况进行包的划分,会把上层(Netty层)的ByteBuf包,进行重新的划分和重组,组成一帧一帧的二进制数据。换句话说,一个上层Netty中的 ByteBuf包,可能会被TCP底层拆分成多个二进制数据帧进行发送;也有可能,底层将多个小的ByteBuf包,封装成一个大的底层数据帧发送出去。

问题来了:如何从底层的二进制数据帧中,界定出来上层数据包的边界,也即是上层包的起点和末尾呢?别急,界定的办法,还是很多的。比如说,简单一点方法就是规定上层数据包的长度。例如,规定每个上层数据包的长度为100byte。再比如说,可以规定上层包的分割符号,比如换行符。无论采用什么方法,最为重要的是,发送方和接收方,在界定方法上必须保持一致。

Netty中,提供了几个重要的可以直接使用的帧解码器。这里先介绍一个最为基础的,它就是LineBasedFrameDecoder。LineBasedFrameDecoder的工作原理很简单,依次遍历原始ByteBuf(代表底层帧)中的可读字节,判断看是否存在“\n”或者“\r\n”换行符,也就是上层包的边界的分割符。如果有,就以此位置为结束位置,从可读索引到结束位置区间的字节就组成了一行。同时,它支持配置上层包的最大长度。如果连续读取到最大长度后仍然没有发现换行符,就会抛出异常。

下面演示一下LineBasedFrameDecoder的使用,代码如下:


/**
* create by 尼恩 @ 疯狂创客圈
**/
package com.crazymakercircle.NettyTest; //... public class TestDecoder { @Test public void testLineBasedFrameDecoder() { //... ChannelInitializer i = new ChannelInitializer<EmbeddedChannel>() { ​ protected void initChannel(EmbeddedChannel ch) { ​ ch.pipeline().addLast(new LineBasedFrameDecoder(1024)); ​ ch.pipeline().addLast(new StringDecoder()); ​ ch.pipeline().addLast(new StringProcessHandler()); ​ } }; EmbeddedChannel channel = new EmbeddedChannel(i); for (int j = 0; j < 100; j++) { ​ ByteBuf buf = Unpooled.buffer(); ​ String s = "I am " + j; ​ buf.writeBytes(s.getBytes("UTF-8")); ​ buf.writeBytes("\r\n".getBytes("UTF-8")); ​ channel.writeInbound(buf); } //... }

实例中,向channel写入100个入站数据包,每一个入站包都以"\r\n"回车换行符作为结束。channel的LineBasedFrameDecoder 解码器,会将"\r\n"作为分割符,分割出一个一个的入站ByteBuf,然后发送给StringDecoder。StringDecoder会将分割好的ByteBuf二进制数据,转成字符串,发送给StringProcessHandler 。最后,由StringProcessHandler负责将字符串展示出来。

这里,LineBasedFrameDecoder 和StringDecoder 都是Netty自带的类。特别要说下的,就是StringDecoder,它的作用是将接收到ByteBuf二进制数据,转换成字符串。另外,LineBasedFrameDecoder ,是一个非常简单的帧解码器,包含此解码器在内,Netty中比较常用的帧解码器,大致如下:

(1)固定长度帧解码器 - FixedLengthFrameDecoder

适用场景:每个上层数据包的长度,都是固定的,比如 100。在这种场景下,只需要把这个解码器加到 pipeline 中,Netty 会把底层帧,拆分成一个个长度为 100 的数据包 (ByteBuf),发送到下一个 channelHandler入站处理器。

(2)行分割帧解码器 - LineBasedFrameDecoder

适用场景:每个上层数据包,使用换行符或者回车换行符做为边界分割符。发送端发送的时候,每个数据包之间以换行符/回车换行符作为分隔。在这种场景下,只需要把这个解码器加到 pipeline 中,Netty 会使用换行分隔符,把底层帧分割成一个一个完整的应用层数据包,发送到下一站。前面的例子,已经对这个解码器进行了演示。

(3)自定义分隔符帧解码器 - DelimiterBasedFrameDecoder

DelimiterBasedFrameDecoder 是LineBasedFrameDecoder的通用版本。不同之处在于,这个解码器,可以自定义分隔符,而不是局限于换行符。如果使用这个解码器,在发送的时候,末尾必须带上对应的分隔符。

(4)自定义长度帧解码器 - LengthFieldBasedFrameDecoder

这是一种基于灵活长度的解码器。在数据包中,加了一个长度字段(长度域),保存上层包的长度。解码的时候,会按照这个长度,进行上层ByteBuf应用包的提取。

1.1.1. 难点:自定义长度帧解码器

在前面的四个帧解码器中,第四个解码器LengthFieldBasedFrameDecoder(自定义长度帧解码器)的参数比较多,比较难,同时也比较重要,这里对其进行重点介绍。

下面是一个简单的使用实例,代码如下:

/**
* create by 尼恩 @ 疯狂创客圈
**/
package com.crazymakercircle.NettyTest; public class TestDecoder { //... @Test public void testLengthFieldBasedFrameDecoder() { try { LengthFieldBasedFrameDecoder spliter=new LengthFieldBasedFrameDecoder(1024,0,4,0,4); ​ ChannelInitializer i = new ChannelInitializer<EmbeddedChannel>() { ​ protected void initChannel(EmbeddedChannel ch) { ​ ch.pipeline().addLast(spliter); ​ ch.pipeline().addLast(new StringDecoder(Charset.forName("UTF-8"))); ​ ch.pipeline().addLast(new StringProcessHandler()); ​ } ​ }; ​ EmbeddedChannel channel = new EmbeddedChannel(i); ​ for (int j = 0; j < 100; j++) { ​ ByteBuf buf = Unpooled.buffer(); ​ String s = "呵呵,I am " + j; ​ byte[] bytes = s.getBytes("UTF-8"); ​ buf.writeInt(bytes.length); ​ buf.writeBytes(bytes); ​ channel.writeInbound(buf); ​ } //... }

上面用到的自定义长度解码器LengthFieldBasedFrameDecoder构造器,涉及5个参数,都与长度域(数据包中的长度字段)相关,具体介绍如下:

(1) maxFrameLength - 发送的数据包最大长度;

(2) lengthFieldOffset - 长度域偏移量,指的是长度域位于整个数据包字节数组中的下标;

(3) lengthFieldLength - 长度域的自己的字节数长度。

(4) lengthAdjustment – 长度域的偏移量矫正。 如果长度域的值,除了包含有效数据域的长度外,还包含了其他域(如长度域自身)长度,那么,就需要进行矫正。矫正的值为:包长 - 长度域的值 – 长度域偏移 – 长度域长。

(5) initialBytesToStrip – 丢弃的起始字节数。丢弃处于有效数据前面的字节数量。比如前面有4个节点的长度域,则它的值为4。

在上面的例子中,自定义长度解码器的构造参数值如下:

  LengthFieldBasedFrameDecoder spliter=new LengthFieldBasedFrameDecoder(1024,0,4,0,4);

第一个参数为1024,表示数据包的最大长度为1024;第二个参数0,表示长度域的偏移量为0,也就是长度域放在了最前面,处于包的起始位置;第三个参数为4,表示长度域占用4个字节;第四个参数为0,表示长度域保存的值,仅仅为有效数据长度,不包含其他域(如长度域)的长度;第五个参数为4,表示最终的取到的目标数据包,抛弃最前面的4个字节数据,长度域的值被抛弃。

为了更加清楚的说明一下上面的规则,调整一下例子中的代码。在写入通道前,在数据包的最前面,加上两个字节,作为包头Head。另外,写入的长度值,包含长度域自身的长度,也就是加上4。 修改后的代码如下:

/**
* create by 尼恩 @ 疯狂创客圈
**/ //... for (int j = 0; j < 100; j++) { ​ ByteBuf buf = Unpooled.buffer(); ​ String s = j+ " is me ,呵呵" ; ​ byte[] bytes = s.getBytes("UTF-8"); ​ buf.writeChar(100); ​ buf.writeInt(bytes.length+4); ​ buf.writeBytes(bytes); } //...

为了完成正确的解码,需要调整自定义长度解码器的构造参数值,调整如下:

  LengthFieldBasedFrameDecoder spliter=new LengthFieldBasedFrameDecoder(1024,2,4,-4,6);

第一、第二、第三个参数比较简单,不再啰嗦。

第四个参数长度域的矫正值为 -4,为什么呢? 它计算的方法是:包长(X+2)- 长度域的值(X) – 长度域偏移(2) – 长度域长(4)= -4 。

这里假定长度域的值为X,那么包长为X+2。因为在这个例子中,长度域的值,已经包括了长度域的长度值。长度域值与整个包长度相比,就少了前面的Header的2个字节。按照公式进行计算,最终的值为 2-2-4 = -4 。

第五个参数丢弃的起始字节数为6,为什么呢? 因为,最终的有效的应用层数据,需要去掉前面的6个字节。其中,包括2个字节的Header,4个字节的长度域长。

写在最后

目前和几个小伙伴一起,组织了一个高并发的实战社群【疯狂创客圈】,完成整个项目的完整的架构和开发实战,欢迎参与。


疯狂创客圈 亿级流量 高并发IM 学习实战

  • Java (Netty) 聊天程序【 亿级流量】实战 开源项目实战

LengthFieldBasedFrameDecoder 秒懂的更多相关文章

  1. 30秒懂SQL中的join(2幅图+30秒)

    废话不多说,直接上图秒懂. t1表的结构与数据如下: t2表的结构与数据如下: inner join select * from t1 inner join t2 on t1.id = t2.id; ...

  2. netty中LengthFieldBasedFrameDecoder的使用

    在org.jboss.netty.handler.codec.frame包中,有LengthFieldBasedFrameDecoder类用来解析带有长度属性的包,只要我们在传输协议中加入包的总长度就 ...

  3. Netty 中 LengthFieldBasedFrameDecoder 构造函数取值备忘

    public LengthFieldBasedFrameDecoder(ByteOrder byteOrder, int maxFrameLength, int lengthFieldOffset, ...

  4. 数学和物理太难?这些 GIF 让你秒懂抽象概念

    把科学带回家,给孩子最好的科学教育 觉得数学和物理很抽象很难懂吗?今天我们来分享一组数学和物理相关的动图,让你秒懂抽象概念. 数学动图 △ 从椭圆的一个焦点射出的光线总会通过另一个焦点. △ 真人版. ...

  5. Netty的ByteToMessageDecoder/LengthFieldBasedFrameDecoder

    是个inbound handler,channelRead方法里面,用一个bytebuf(cumulation)来把下一个数据包和当前这一个拼在一起,以免同一个请求被拆包.然后callDecode,里 ...

  6. 一幅图秒懂LoadAverage(负载)

    转自:http://www.habadog.com/2015/02/27/what-is-load-average/ 一幅图秒懂LoadAverage(负载)   一.什么是Load Average? ...

  7. 【转】netty源码分析之LengthFieldBasedFrameDecoder

    原文:https://www.jianshu.com/p/a0a51fd79f62 拆包的原理 关于拆包原理的上一篇博文 netty源码分析之拆包器的奥秘 中已详细阐述,这里简单总结下:netty的拆 ...

  8. netty之LengthFieldBasedFrameDecoder解码器

    官方api:http://netty.io/4.1/api/io/netty/handler/codec/LengthFieldBasedFrameDecoder.html package com.e ...

  9. 一幅图秒懂LoadAverage(转载)

    转自:http://www.habadog.com/2015/02/27/what-is-load-average/ 一幅图秒懂LoadAverage(负载)   一.什么是Load Average? ...

随机推荐

  1. ASP.NET MVC学习---(五)MVC初体验

    经过之前n多的铺垫 我们已经大概了解了这个姓m名vc的家伙了 那么今天我们就来体验一把 怎么体验呢? 就来做一个小例子吧~ mvc增删改查的例子 数据库还是之前我们的老朋友 关系图: 表中的数据已填好 ...

  2. 2016.6.29 tomcat卸载后在安装出现错误:failed to install tomcat7 service

    错误如下:   错误原因: 直接删除了安装目录,而不是点击卸载(包含删除服务) 因此在此安装时,显示安装服务失败(因为已经存在了)   解决办法: (1)手动删除注册表 regedit.exe,找到H ...

  3. div 事件透传

    有些时候,我们会想要把一个 div 层覆盖在另一个 div 层上,要让下层的 div 响应鼠标事件而上层的不响应仅仅只做内容展示. 这种时候,我们就可以用到一个 CSS 属性:pointer-even ...

  4. python中ascii码和字符的转换

    将ASCII字符转换为对应的数值即‘a’-->65,使用ord函数,ord('a') 反正,使用chr函数,将数值转换为对应的ASCII字符,chr(65)

  5. centos 6.x Python2.7x安装

    centos 6.x Python2.7x安装 yum install -y gcc gcc-develwget https://www.python.org/ftp/python/2.7.14/Py ...

  6. Tomcat Connector的三种不同的运行模式

    Tomcat Connector的三种不同的运行模式性能相差很大,有人测试过的结果如下: 这三种模式的不同之处如下: BIO: 一个线程处理一个请求.缺点:并发量高时,线程数较多,浪费资源. Tomc ...

  7. redhat 用yum安装的apache、mysql一般默认安装在哪个目录下?

    使用yum安装成功后,使用rpm -qa | grep httpd和rpm -qa | grep mysql查看是否安装成功然后使用rpm -ql httpd和rpm -ql mysql查看安装文件都 ...

  8. JavaScript对象this指向(普通键this指向 非指向函数的键)

    1.结论 JavaScript对象普通键(非指向函数的键)this指向是window. 2.示例 <!DOCTYPE html> <html lang="zh"& ...

  9. java编程思想读书笔记 第十二章 通过异常处理错误(下)

    1.异常的限制 当覆盖方法的时候,仅仅能抛出在基类方法的异常说明里列出的那些异常. 这意味着,当基类使用的代码应用到其派生类对象的时候,一样能够工资,异常也不例外. 以下的样例是在编译时施加在异常上面 ...

  10. 每天一个JavaScript实例-展示设置和获取CSS样式设置

    <!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content ...