C++读入XML文件

最近要做一个VRP的算法，测试集都是放在Xml文件中，而我的算法使用C++来写，所以需要用C++来读取Xml文件。

在百度上搜“C++读取Xml文件”，可以出来很多博客，大多数是关于tinyXml的，所以这篇博文也是讲述如何用tinyXML来读取XML文件。

有些内容可能参考到了@marchtea的博文《C++读取XML，tinyXml的使用》：http://www.cnblogs.com/marchtea/archive/2012/11/08/2760593.html。

tinyXml是一个免费开源的C++库，可以到官网上下载：https://sourceforge.net/projects/tinyxml/。

下载下来解压之后，可以看到下面这些文件：

我是在windows下用VS来写C++的，按照@marchtea的说法，只需要直接打开tinyxml.sln就可以，不过我还是用了笨办法：

把tinystr.cpp, tinyxml.cpp, tinyxmlerror.cpp, tinyxmlparser.cpp, tinystr.h, tinyxml.h拷贝到工程目录下；
然后加入头文件引用：#include "tinystr.h" #include "tinyxml.h"。

接下来就来分享一下我读取VRP问题中的solomon benchmark的方法，这些方法都是参考自tinyXml的官方教程，在下载的文件夹中有"doc"子文件夹，打开它，有一个叫做"tutorial0"的html文件，打开它可以看到详细的教程。

OK，now begins！

我要读取的Xml文件有如下的格式（只列举部分）：

<!-- 要读取的Xml文件 -->

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>

<instance>

    <network>

        <nodes>

            <node id="0" type="0">

                <cx>40.0</cx>

                <cy>50.0</cy>

            </node>

        <!--  有N+1个这样的node节点 -->

        </nodes>

    </network>

    <requests>

        <request id="1" node="1">

            <tw>

                <start>145</start>

                <end>175</end>

            </tw>

            <quantity>20.0</quantity>

            <service_time>10.0</service_time>

        </request>

        <!-- 有N个这样的request节点 -->

    </requests>

</instance>

这里稍微解释一下为什么nodes节点的数目会比requests节点多1个。这是因为nodes节点包括了顾客节点（N个）和仓库节点（1个），而requests属性只属于顾客节点。

我是把xml文件中的这些数据读入到类对象数组中，每个类对象代表一个节点，类的定义如下：

// Customer.h

#ifndef _Customer_H

#define _Customer_H

class Customer{

public:

	Customer(int id=0, float x=0, float y=0, float startTime=0, float endTime=0, float quantity=0, float serviceTime=0);

	void setId(int id);   // 设置成员id的值

	void setX(float x);   // 设置成员x的值

	void setY(float y);   // 设置成员y的值

	void setStartTime(float startTime);  // 设置成员startTime的值

	void setEndTime(float endTime);      // 设置成员endTime的值

	void setQuantity(float quantity);    // 设置成员quantity的值

	void setServiceTime(float serviceTime);  // 设置成员serviceTime的值

	void show();  // 显示顾客节点信息

private:

	int id;

	float x;

	float y;

	float startTime;

	float endTime;

	float quantity;

	float serviceTime;

};

#endif

OK，那么现在开始贴一下main.cpp代码（Customer.cpp比较简单，就不贴了）

// main.cpp

#include "Customer.h"

#include "tinystr.h"

#include "tinyxml.h"

#include<iostream>

#include<vector>

#include<string>

#include<stdlib.h>

#include<iomanip>

using namespace std;

static const int NUM_OF_CUSTOMER = 51;        //顾客数量

static const char* FILENAME = "RC101_050.xml";  //文件名

int main(){

	vector<Customer *> customerSet(0);  // 顾客集，每个元素是Customer对象的指针

	int i,j,k,count;

	int temp1;    // 存放整型数据

	float temp2;  // 存放浮点型数据

	Customer* customer;   // 临时顾客节点指针

	for (i=0; i<NUM_OF_CUSTOMER; i++) {  // 先初始化顾客集

		customer = new Customer();

		customerSet.push_back(customer);

	}

	TiXmlDocument doc(FILENAME);    // 读入XML文件

	if(!doc.LoadFile()) return -1;  // 如果无法读取文件，则返回

	TiXmlHandle hDoc(&doc);         // hDoc是&doc指向的对象

	TiXmlElement* pElem;            // 指向元素的指针

	pElem = hDoc.FirstChildElement().Element(); //指向根节点

	TiXmlHandle hRoot(pElem);       // hRoot是根节点

	// 读取x,y，它们放在network->nodes->node节点中

	TiXmlElement* nodeElem = hRoot.FirstChild("network").FirstChild("nodes").FirstChild("node").Element(); //当前指向了node节点

	count = 0;  // 记录移动到了哪个node节点，并且把该node节点的信息录入到顺序对应的customer中

	for(nodeElem; nodeElem; nodeElem = nodeElem->NextSiblingElement()) { // 挨个读取node节点的信息

		customer = customerSet[count];  // 当前顾客节点，注意不能赋值给一个新的对象，否则会调用复制构造函数

		TiXmlHandle node(nodeElem);  // nodeElem所指向的节点

		TiXmlElement* xElem = node.FirstChild("cx").Element();  // cx节点

		TiXmlElement* yElem = node.FirstChild("cy").Element();  // cy节点

		nodeElem->QueryIntAttribute("id", &temp1);  //把id放到temp1中，属性值读法

		customer->setId(temp1);

		temp2 = atof(xElem->GetText());    // char转float

		customer->setX(temp2);

		temp2 = atof(yElem->GetText());

		customer->setY(temp2);

		count++;

	}

	// 读取其余信息

	TiXmlElement* requestElem = hRoot.FirstChild("requests").FirstChild("request").Element(); // 指向了request节点

	count = 1;

	for(requestElem; requestElem; requestElem = requestElem->NextSiblingElement()) {

		customer = customerSet[count];     // 当前顾客节点，注意不能赋值给一个新的对象，否则会调用复制构造函数

		TiXmlHandle request(requestElem);  // 指针指向的对象

		TiXmlElement* startTimeElem = request.FirstChild("tw").FirstChild("start").Element(); // start time

		TiXmlElement* endTimeElem = request.FirstChild("tw").FirstChild("end").Element();     // end time

		TiXmlElement* quantityElem = request.FirstChild("quantity").Element();                // quantity

		TiXmlElement* serviceTimeElem = request.FirstChild("service_time").Element();         // service time

		// 分别读取各项数据

		temp2 = atof(startTimeElem->GetText());

		customer->setStartTime(temp2);

		temp2 = atof(endTimeElem->GetText());

		customer->setEndTime(temp2);

		temp2 = atof(quantityElem->GetText());

		customer->setQuantity(temp2);

		temp2 = atof(serviceTimeElem->GetText());

		customer->setServiceTime(temp2);

		count++;

	}

	// 将读取到的信息输出到控制台

	cout<<setiosflags(ios_base::left)<<setw(6)<<"id"<<setw(6)<<"x"<<setw(6)<<

		"y"<<setw(12)<<"startTime"<<setw(12)<<"endTime"<<setw(12)<<"quantity"<<setw(14)<<"serviceTime"<<endl;

	for(i=0; i<NUM_OF_CUSTOMER; i++) {

		customer = customerSet[i];

		customer->show();

	}

	system("pause");

	return 0;

}

在解释main.cpp的内容之前，先解释一下一些数据类型（只是个人理解，欢迎纠错）：

TiXmlDocument：文件节点，把Xml文件的内容读入到该类型变量中
TiXmlElement*：指向节点的指针
TiXmlHandle：节点的实例，也就是TiXmlElement所指向的对象
FirstChild("nodeName")：第一个名字为“nodeName”的子节点
NextSiblingElement()：下一个兄弟节点元素，它们有相同的父节点
QueryIntAttribute("attributeName", &var)：把节点属性名为attributeName的属性值以int类型赋值给var变量
GetText()：获取当前节点元素的内容，即包含在<node>text</node>中的text

OK，有了以上一些简单的知识积累，就可以很方便地读取Xml文件了，现在截取xml的部分来讲解：

<instance>

    <network>

        <nodes>

            <node id="0" type="0">

                <cx>40.0</cx>

                <cy>50.0</cy>

            </node>

        <!--  有N+1个这样的node节点 -->

        </nodes>

    </network>

    .....

</instance>

在这部分我们会把顾客的id，坐标x,y都读入到Customer对象中。　

1. 首先我们得到了文件节点hDoc，现在我们要进入根节点"instance"：

TiXmlElement* pElem;            // 指向元素的指针

pElem = hDoc.FirstChildElement().Element(); //指向根节点

TiXmlHandle hRoot(pElem);       // hRoot是根节点

根节点"instance"是文件节点的第一个子节点，所以用 pElem = hDoc.FirstChildElement().Element() 就可以使得指针pElem指向"instance"，hRoot是pElem所指向的对象。

2. 现在我们需要进入到“node”节点中，遍历其兄弟节点，将所有数据读入。下面的语句可以将第一个“node”节点的指针赋值给nodeElem:

TiXmlElement* nodeElem = hRoot.FirstChild("network").FirstChild("nodes").FirstChild("node").Element(); //当前指向了node节点

节点的id值放在"node"节点的属性"id"中：

nodeElem->QueryIntAttribute("id", &temp1);  //把id放到temp1中，属性值读法

然后坐标x, y的值放在“node”节点的子节点"cx"和"cy"的内容(text)中，所以我们这样来读取：

TiXmlElement* xElem = node.FirstChild("cx").Element();  // cx节点

temp2 = atof(xElem->GetText());    // char转float

函数atof在库<stdlib>中，用以将char数组转化为浮点数。

通过1,2两步，我们已经把第一个“node”节点的id, x, y的值读入到对象中，然后只需要把遍历所有的兄弟节点即可：

for(nodeElem; nodeElem; nodeElem = nodeElem->NextSiblingElement()) {

......

}

读入requests节点下的startTime, endTime, quantity, serviceTime等值的方法也是一样的，详情参考main.cpp代码。

运行结果如下：

总结：

其实说白了读取Xml文件的关键在于：

移动指针到所要读取数据的节点中；　
若是读取属性值，则使用QueryIntAttribute方法直接读取；
若读取的是节点的内容，则使用getText()方法读取；
连续的数据具有兄弟节点关系，使用NextSiblingElement()方法来指向下一个兄弟节点

后记：

这篇博文只介绍了如何读取Xml文件，至于如何写入Xml文件，请参考tinyXml的官方教程，讲的特别清楚，特别良心。

希望大家看了之后有所收获，欢迎交流。

C++读入XML文件的更多相关文章

将字符串以用二进制流的形式读入XML文件
其实将字符串写入XML文件本身并不复杂,这里只是写一些需要注意的地方,特别是编码格式,这里需要的是XML默认的编码方式是UTF-8,在对字符串进行编码的时候一定要注意, string strRecei ...
按行读入xml文件，删除不需要的行 -Java
删除挺麻烦的,这里其实只是把需要的行存到arraylist中再存到另一个文件中 import java.io.BufferedReader;import java.io.BufferedWriter; ...
matlab xml文件交互
xml文件以文档对象模型表示,简称DOM(Document Object Model).在Matlab中,使用xmlread读取xml文件成DOM节点,对xml文件的操作转化成对DOM节点的操作,使用 ...
DOM、SAX、JDOM、DOM4J以及PULL在XML文件解析中的工作原理以及优缺点对比
1. DOM(Document Object Model)文档对象模型1. DOM是W3C指定的一套规范标准,核心是按树形结构处理数据,DOM解析器读入XML文件并在内存中建立一个结构一模一样的&qu ...
使用SAXReader读取ftp服务器上的xml文件（原创）
根据项目需求,需要监测ftp服务器上的文件变化情况,并将新添加的文件读入项目系统(不需要下载). spring配置定时任务就不多说了,需要注意的一点就是,现在的项目很多都是通过maven构建的,分好多 ...
Qt Write and Read XML File 读写XML文件
在Qt中,我们有时候需要把一些参数写入xml文件,方便以后可以读入,类似一种存档读档的操作,例如,我们想生成如下的xml文件: <?xml version="1.0" enc ...
# java对xml文件的基本操作
下面是简单的总结三种常用的java对xml文件的操作 1. dom方式对xml进行操作,这种操作原理是将整个xml文档读入内存总,在内存中进行操作,当xml文档非常庞大的时候就会出现内存溢出的异常,这 ...
转:VC解析XML文件-CMarkup的使用详解
本篇文章是对VC解析XML文件-CMarkup的使用进行了详细的分析介绍,需要的朋友参考下 VC解析XML文件的工具有很多,CMarkup, tinyXML,还有IBM的,MS的等等. 据说tinyX ...
NSXMLParser读取XML文件并将数据显示到TableView上
关于XML,有两种解析方式,分别是SAX(Simple API for XML,基于事件驱动的解析方式,逐行解析数据,采用协议回调机制)和DOM(Document Object Model ,文档对象 ...

随机推荐

asp.net 各种路径
Request.Path 是包含文件名的,而 Request.ApplicationPath 是应用程序路径,不包含文件名. 示例: Request.Path = /cftea/Default.asp ...
CAD厂商的一丢丢笔记
Cadence Cadence是个公司名,产品有: OrCAD,画原理图的 Allegro,画PCB的,PrintedCircuitBoard. Mentor,暂时还不知道画什么的 Autodesk ...
Delphi编程获取系统当前进程、窗口句柄、文件属性以（转）
Delphi编程获取系统当前进程.窗口句柄.文件属性以及程序运行状态. uses TLHelp32,PsAPI; (1)显示进程列表:procedure TForm1.Button2Click(Sen ...
[delphi]向ImageList中加入png类型的资源图片
向ImageList中动态加入Png图片有些失真,经过多方查询,发现需要将Bitmap的AlphaFormat指定一下. //向ImageList中加入png类型的资源图片 procedure Add ...
自己修改的两个js文件
sea-base.js /** * Sea.js 2.2.3 | seajs.org/LICENSE.md */ (function(global, undefined) { // Avoid con ...
bzoj3316: JC loves Mkk
Description Input 第1行,包含三个整数.n,L,R.第2行n个数,代表a[1..n]. Output 仅1行,表示询问答案.如果答案是整数,就输出整数:否则,输出既约分数“P/Q”来 ...
AJAX怎么用POST 传参数
//注册回调函数.注意注册回调函数是不能加括号,加了会把函数的值返回给onreadystatechange xmlhttp.onreadystatechange = callback; //设置连接信 ...
Druid数据库连接池配置
DRUID是阿里巴巴开源平台上一个数据库连接池实现,它结合了C3P0.DBCP.PROXOOL等DB池的优点,同时加入了日志监控,可以很好的监控DB池连接和SQL的执行情况,可以说是针对监控而生的DB ...
【转】EXCEL不显示科学计数法
源地址:http://jingyan.baidu.com/article/e4d08ffdcc304e0fd3f60d69.html 2法无效,不知道为何
IOPS-百度百科
IOPS (Input/Output Operations Per Second),即每秒进行读写(I/O)操作的次数,多用于数据库等场合,衡量随机访问的性能.存储端的IOPS性能和主机端的IO是不同 ...

C++读入XML文件

C++读入XML文件的更多相关文章

随机推荐

热门专题