XML文件解析数据结构
最近在解析Android安装包内经过编译的二进制XML文件时想在内存中建立起其对应的树结构。
想了一早晨,思路如下图。

多叉树中的每个节点除了有子节点和兄弟节点以外还有一个指针指向父节点,然后根据状态转移图执行相应的代码就行。
public void main() {
XmlTagTree tree = new XmlTagTree();
while (true) {
// 获取xml标签
Tag tag = getTag();
if (tag.isStartTag()) {
tree.addNode(tag, XmlTagTree.STATE_START);
} else if (tag.isEndTag()){
tree.addNode(null, XmlTagTree.STATE_END);
}
}
}
class Tag {
private Tag parent;
private Tag child;
private Tag next;
}
class XmlTagTree {
public final static int STATE_START = 0;
public final static int STATE_END = 1;
private int mCurrentState = STATE_START;
private Tag mRoot;
private Tag mCurrent;
private XmlTreeOperate[][] mOperates;
private int mSize = 0;
public XmlTagTree() {
mOperates = new XmlTreeOperate[2][2];
mOperates[STATE_START][STATE_START] = new XmlTreeOperate() {
@Override
public void operate(Tag chunk, int state) {
if (mRoot == null) {
// 第一次操作,初始化节点
mRoot = chunk;
mCurrent = chunk;
} else {
// (START, START) -> addChild
mCurrent.child = chunk;
chunk.parent = mCurrent;
mCurrent = chunk;
++mSize;
}
}
};
mOperates[STATE_START][STATE_END] = new XmlTreeOperate() {
@Override
public void operate(Tag chunk, int state) {
// (START, END) -> none
// do not do anything
}
};
mOperates[STATE_END][STATE_START] = new XmlTreeOperate() {
@Override
public void operate(Tag chunk, int state) {
// (END, START) -> addSibling
mCurrent.next = chunk;
chunk.parent = mCurrent.parent;
mCurrent = chunk;
++mSize;
}
};
mOperates[STATE_END][STATE_END] = new XmlTreeOperate() {
@Override
public void operate(Tag chunk, int state) {
// (END, END) -> goParent
mCurrent = mCurrent.parent;
}
};
}
public void addNode(Tag chunk, int state) {
if (mRoot == null && state != STATE_START) {
throw new RuntimeException("first state in XmlTagTree must be STATE_START");
}
mOperates[mCurrentState][state].operate(chunk, state);
mCurrentState = state;
}
private interface XmlTreeOperate {
void operate(Tag chunk, int state);
}
}
XML文件解析数据结构的更多相关文章
- 通过正则表达式实现简单xml文件解析
这是我通过正则表达式实现的xml文件解析工具,有些XHTML文件中包含特殊符号,暂时还无法正常使用. 设计思路:常见的xml文件都是单根树结构,工具的目的是通过递归的方式将整个文档树装载进一个Node ...
- 八、Android学习第七天——XML文件解析方法(转)
(转自:http://wenku.baidu.com/view/af39b3164431b90d6c85c72f.html) 八.Android学习第七天——XML文件解析方法 XML文件:exten ...
- android基础知识13:AndroidManifest.xml文件解析
注:本文转载于:http://blog.csdn.net/xianming01/article/details/7526987 AndroidManifest.xml文件解析. 1.重要性 Andro ...
- Android之AndroidManifest.xml文件解析
转自:Android学习笔记之AndroidManifest.xml文件解析 一.关于AndroidManifest.xml AndroidManifest.xml 是每个android程序中必须的文 ...
- 9.XML文件解析
一.XML简介 XML(EXtensible Markup Language),可扩展标记语言 特点:XML与操作系统.编程语言的开发平台无关 实现不同系统之间的数据交换 作用:数据交互 配置应用程序 ...
- Python实现XML文件解析
1. XML简介 XML(eXtensible Markup Language)指可扩展标记语言,被设计用来传输和存储数据,已经日趋成为当前许多新生技术的核心,在不同的领域都有着不同的应用.它是web ...
- Python3将xml文件解析为Python对象
一.说明 从最开始写javascript开始,我就很烦感使用getElementById()等函数来获取节点的方法,获取了一个节点要访问其子孙节点要么child半天要么就再来一个getElementB ...
- XML文件解析-DOM4J方式和SAX方式
最近遇到的工作内容都是和xml内容解析相关的. 1图片数据以base64编码的方式保存在xml的一个标签中,xml文件通过接口的方式发送给我,然后我去解析出图片数据,对图片进行进一步处理. 2.xml ...
- java基础之概谈xml文件解析
XML已经成为一种非常通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便. 诸多web应用框架,其可配置的编程方式,给我们的开发带来了非常大程度的便捷,但细细 ...
随机推荐
- HiveSchemaTool-Parsing failed. Reason- Unrecognized option- -dbType mysql
版本: Hive2.1 在linux上部署Hive的时候,初始化元数据的时候,出现HiveSchemaTool:Parsing failed. Reason: Unrecognized option: ...
- .NET Core 快速入门教程
.NET Core 快速学习.入门系列教程.这个入门系列教程主要跟大家聊聊.NET Core的前世今生,以及Windows.Linux(CentOS.Ubuntu)基础开发环境的搭建.第一个.NET ...
- API Gateway - KONG 安装与配置
简介 Kong,是由Mashape公司开源的,基于Nginx的API gateway 特点 可扩展,支持分布式 模块化 功能:授权.日志.ip限制.限流.api 统计分析(存在商业插件Galileo等 ...
- DEBUG技巧-设定合适的日志级别
有些技能只有踩过坑的人才能够掌握,能用来避免后来的坑,很多时候是用凌晨的时间换来的,我们通常把他叫做经验. 故事 这个一个关于springmvc的坑的故事. 某天晚上本打算一个小功能分分钟搞定上线,但 ...
- cpci热插拔信号
cpci热插拔信号1 BD_SEL#信号.对外围板是输入,是个1对1信号,来自背板的热插拔控制电路输出.每一个槽一个独立信号.用于控制热插拔外围板的上电控制.不实现热插拔的在背板直接接地:2 HEAL ...
- jsp内置对象 的使用范围和类型【说明】
jsp内置对象 jsp内置对象有以下9种,我们会在后面的章节中分别介绍他们.这9种对象例如以下: 名称 类型 使用范围 request javax.servlet.http.HttpServletRe ...
- string的内存管理问题
string的内存管理是通过仅仅增不减的方式进行的,string的clear方法不会真正的释放内存,假设须要真正的释放内存可以连续调用string的这两个方法.resize(0),reserve(). ...
- Simple prefix compression
题目 看懂题目的意思 直接模拟就能够了 好像不用递归就能够了. . 尽管这周学的是递归 还是偷了一些懒 直接模拟 在说这个题目的意思 本来能够写的非常清楚的下标 题目非要把两个字符串的表示方法写的这 ...
- Configuring WS-Security UsernameToken and WS-SecureConversation (Symmetric Connection Creation)
Context This procedure provides a detailed process of all necessary steps to secure Web Services wit ...
- Codeforces548A:Mike and Fax
While Mike was walking in the subway, all the stuff in his back-bag dropped on the ground. There wer ...