简介

在json之前，xml是最常用的数据传输格式，虽然xml的冗余数据有点多，但是xml的结构简单清晰，至今仍然运用在程序中的不同地方，对于netty来说自然也提供了对于xml数据的支持。

netty对xml的支持表现在两个方面，第一个方面是将编码过后的多个xml数据进行frame拆分，每个frame包含一个完整的xml。另一方面是将分割好的frame进行xml的语义解析。

进行frame拆分可以使用XmlFrameDecoder,进行xml文件内容的解析则可以使用XmlDecoder，接下来我们会详细讲解两个decoder实现和使用。

XmlFrameDecoder

因为我们收到的是数据流，所以不确定收到的数据到底是什么样的，一个正常的xml数据可能会被拆分成多个数据frame。

如下所示:

   +-------+-----+--------------+

   | <this | IsA | XMLElement/> |

   +-------+-----+--------------+

这是一个正常的xml数据，但是被拆分成为了三个frame，所以我们需要将其合并成为一个frame如下：

   +-----------------+

   | <thisIsAXMLElement/> |

   +-----------------+

还有可能不同的xml数据被分拆在多个frame中的情况,如下所示：

   +-----+-----+-----------+-----+----------------------------------+

   | <an | Xml | Element/> | <ro | ot><child>content</child></root> |

   +-----+-----+-----------+-----+----------------------------------+

上面的数据需要拆分成为两个frame：

   +-----------------+-------------------------------------+

   | <anXmlElement/> | <root><child>content</child></root> |

   +-----------------+-------------------------------------+

拆分的逻辑很简单，主要是通过判断xml的分隔符的位置来判断xml是否开始或者结束。xml中的分隔符有三个，分别是'<', '>' 和 '/'。

在decode方法中只需要判断这三个分隔符即可。

另外还有一些额外的判断逻辑，比如是否是有效的xml开始字符：

    private static boolean isValidStartCharForXmlElement(final byte b) {

        return b >= 'a' && b <= 'z' || b >= 'A' && b <= 'Z' || b == ':' || b == '_';

    }

是否是注释:

    private static boolean isCommentBlockStart(final ByteBuf in, final int i) {

        return i < in.writerIndex() - 3

                && in.getByte(i + 2) == '-'

                && in.getByte(i + 3) == '-';

    }

是否是CDATA数据：

    private static boolean isCDATABlockStart(final ByteBuf in, final int i) {

        return i < in.writerIndex() - 8

                && in.getByte(i + 2) == '['

                && in.getByte(i + 3) == 'C'

                && in.getByte(i + 4) == 'D'

                && in.getByte(i + 5) == 'A'

                && in.getByte(i + 6) == 'T'

                && in.getByte(i + 7) == 'A'

                && in.getByte(i + 8) == '[';

通过使用这些方法判断好xml数据的起始位置之后，就可以调用extractFrame方法将要使用的ByteBuf从原始数据中拷贝出来，最后放到out中去：

final ByteBuf frame =

                    extractFrame(in, readerIndex + leadingWhiteSpaceCount, xmlElementLength - leadingWhiteSpaceCount);

            in.skipBytes(xmlElementLength);

            out.add(frame);

XmlDecoder

将xml数据拆分成为一个个frame之后，接下来就是对xml中具体数据的解析了。

netty提供了一个xml数据解析的方法叫做XmlDecoder,主要用来对已经是一个单独的xml数据的frame进行实质内容的解析，它的定义如下：

public class XmlDecoder extends ByteToMessageDecoder

XmlDecoder根据读取到的xml内容，将xml的部分拆分为XmlElementStart,XmlAttribute,XmlNamespace,XmlElementEnd,XmlProcessingInstruction,XmlCharacters,XmlComment,XmlSpace,XmlDocumentStart,XmlEntityReference,XmlDTD和XmlCdata。

这些数据基本上覆盖了xml中所有可能出现的元素。

所有的这些元素都是定义在io.netty.handler.codec.xml包中的。

但是XmlDecoder对xml的读取解析则是借用了第三方xml工具包：fasterxml。

XmlDecoder使用了fasterxml中的AsyncXMLStreamReader和AsyncByteArrayFeeder用来进行xml数据的解析。

这两个属性的定义如下：

    private static final AsyncXMLInputFactory XML_INPUT_FACTORY = new InputFactoryImpl();

    private final AsyncXMLStreamReader<AsyncByteArrayFeeder> streamReader;

    private final AsyncByteArrayFeeder streamFeeder;

            this.streamReader = XML_INPUT_FACTORY.createAsyncForByteArray();

        this.streamFeeder = (AsyncByteArrayFeeder)this.streamReader.getInputFeeder();

decode的逻辑是通过判断xml element的类型来分别进行不同数据的读取,最后将读取到的数据封装成上面我们提到的各种xml对象，最后将xml对象添加到out list中返回。

总结

我们可以借助XmlFrameDecoder和XmlDecoder来实现非常方便的xml数据解析，netty已经为我们造好轮子了，我们就不需要再自行发明了。

本文已收录于 http://www.flydean.com/14-7-netty-codec-xml/

最通俗的解读，最深刻的干货，最简洁的教程，众多你不知道的小技巧等你来发现！

欢迎关注我的公众号:「程序那些事」,懂技术，更懂你！

netty系列之:netty中常用的xml编码解码器的更多相关文章

Netty 系列之 Netty 高性能之道高性能的三个主题 Netty使得开发者能够轻松地接受大量打开的套接字 Java 序列化
Netty系列之Netty高性能之道 https://www.infoq.cn/article/netty-high-performance 李林锋 2014 年 5 月 29 日话题:性能调优语言 ...
【读后感】Netty 系列之 Netty 高性能之道 - 相比 Mina 怎样？
[读后感]Netty 系列之 Netty 高性能之道 - 相比 Mina 怎样 ? 太阳火神的漂亮人生 (http://blog.csdn.net/opengl_es) 本文遵循"署名-非商 ...
ES6系列之项目中常用的新特性
ES6系列之项目中常用的新特性 ES6常用特性平时项目开发中灵活运用ES6+语法可以让开发者减少很多开发时间,提高工作效率.ES6版本提供了很多新的特性,接下来我列举项目中常用的ES6+的特性: l ...
netty系列之:netty中常用的字符串编码解码器
目录简介 netty中的字符串编码解码器不同平台的换行符字符串编码的实现总结简介字符串是我们程序中最常用到的消息格式,也是最简单的消息格式,但是正因为字符串string太过简单,不能附加更 ...
netty系列之:netty中各不同种类的channel详解
目录简介 ServerChannel和它的类型 Epoll和Kqueue AbstractServerChannel ServerSocketChannel ServerDomainSocketCh ...
netty系列之:netty实现http2中的流控制
目录简介 http2中的流控制 netty对http2流控制的封装 Http2FlowController Http2LocalFlowController Http2RemoteFlowContr ...
netty系列之:netty中的核心编码器bytes数组
目录简介 byte是什么 netty中的byte数组的工具类 netty中byte的编码器总结简介我们知道netty中数据传输的核心是ByteBuf,ByteBuf提供了多种数据读写的方法,包 ...
Netty 系列之 Netty 高性能之道
1. 背景 1.1. 惊人的性能数据最近一个圈内朋友通过私信告诉我,通过使用 Netty4 + Thrift 压缩二进制编解码技术,他们实现了 10 W TPS(1 K 的复杂 POJO 对象)的跨 ...
Netty系列之Netty高性能之道
转载自http://www.infoq.com/cn/articles/netty-high-performance 1. 背景 1.1. 惊人的性能数据最近一个圈内朋友通过私信告诉我,通过使用Ne ...

随机推荐

为什么总有target=_blank？
源于Browsing Context 的概念,不仅有_blank,还有_parent, _top, _self等. 先留个坑.见示例.
Web存储之LocalStorage初探
Web存储之LocalStorage初探 HTML5的发布和定稿为前端界带来巨大的变化,新增的API和特性给业务带来了更多可能性,让用户体验拥有了更可能的丰富. · HTML Geolocation ...
CSS系列——浏览器默认样式
了解HTML标签在各浏览器当中的默认样式,可以让我们了解,为什么会要写Reset.css,Reset.css当中要怎么写样式最合理.试着思考下面的问题: 为什么会有默认样式? 每个浏览器的默认样式有什 ...
设计模式之：抽象工厂模式AbstractFactoryPattern的实现
相比于工厂模式,抽象工厂模式的每个工厂可以创建产品系列,而不是一个产品: 抽象工厂用到的技术:接口.多态.配置文件.反射: 抽象工厂模式的设计原则: 实现客户端创建产品和使用产品的分离,客户端无须了解 ...
Java/C++实现访问者模式---购物车
在我们课堂上的"购物车"的例子中,增加一个新的访问者:打包员,负责对购物车中货物装包. 类图: Java代码: public interface Product { void ac ...
audio小记
写H5活动页的需要音频,图标旋转停止保持当时的旋转角度,这样视觉体验效果好: 之前写法是点击pause()就直接停止动画,后来发现了animation有个比较好的属性animation-play-st ...
LC-24
[24. 两两交换链表中的节点](https://leetcode-cn.com/problems/swap-nodes-in-pairs/) 给你一个链表,两两交换其中相邻的节点,并返回交换后链表的 ...
Django中数据传输编码格式、ajax发送json数据、ajax发送文件、django序列化组件、ajax结合sweetalert做二次弹窗、批量增加数据
前后端传输数据的编码格式(contentType) 提交post请求的两种方式: form表单 ajax请求前后端传输数据的编码格式 urlencoded formdata(form表单里的) ja ...
使用Visual Studio 2019开发Qt程序
安装Qt 如标题,你首先需要到 http://download.qt.io/ 去下载并安装Qt,并在引导下安装MSVC组件(这里不做过多解释) Visual Studio 2019 配置打开VS20 ...
JavaScript学习总结9
今天学习了表单提交,JQuery部分知识

netty系列之:netty中常用的xml编码解码器

简介

XmlFrameDecoder

XmlDecoder

总结

netty系列之:netty中常用的xml编码解码器的更多相关文章

随机推荐

热门专题