使用DOM读取XML文档
版权声明
该文章原创于作者yafeilinux,转载请注明出处!
导语
XML(ExtensibleMarkup Language,可扩展标记语言),是一种类似于HTML的标记语言,但它的设计目的是用来传输数据,而不是显示数据。XML的标签没有被预定义,用户需要在使用时自行进行定义。XML是W3C(万维网联盟)的推荐标准。相对于数据库表格的二维表示,XML使用的树形结构更能表现出数据的包含关系,作为一种文本文件格式,XML简单明了的特性使得它在信息存储和描述领域非常流行。
在Qt中提供了QtXml模块来进行XML文档的处理,我们在Qt帮助中输入关键字QtXml Module,可以看到该模块的类表。这里主要提供了三种解析方法:DOM方法,可以进行读写;SAX方法,可以进行读取;基于流的方法,分别使用QXmlStreamReader和QXmlStreamWriter进行读取和写入。要在项目中使用QtXml模块,还需要在项目文件(.pro文件)中添加QT += xml一行代码。这一节我们先来讲解一下DOM的方法。
环境:
Windows Xp + Qt 4.8.4+QtCreator 2.6.2
目录
一、XML
文档示例
正文
一、XML文档示例
下面是一个规范的XML
文档:
<?xml version="1.0"encoding="UTF-8"?>
<library>
<book id="01">
<title>Qt</title>
<author>shiming</author>
</book>
<book id="02">
<title>Linux</title>
<author>yafei</author>
</book>
</library>
每个XML
文档都由XML
说明(或者称为XML
序言)开始,它是对XML
文档处理的环境和要求的说明,比如这里的<?xmlversion="1.0" encoding="UTF-8"?>
,其中xml version=“1.0”
,表明使用的XML
版本号,这里字母是区分大小写的;encoding=“UTF-8”
是使用的编码,指出文档是使用何种字符集建立的,默认值为Unicode
编码。XML
文档内容由多个元素组成,一个元素由起始标签<
标签名>
和终止标签</
标签名>
以及两个标签之间的内容组成,而文档中第一个元素被称为根元素,比如这里的<library></library>
,XML
文档必须有且只有一个根元素。元素的名称是区分大小写的,元素还可以嵌套,比如这里的library
、book
、title
和author
等都是元素。元素可以包含属性,用来描述元素的相关信息,属性名和属性值在元素的起始标签中给出,格式为<
元素名
属性名=“
属性值”>
,如<book id=“01”>
,属性值必须在单引号或者双引号中。在元素中可以包含子元素,也可以只包含文本内容,比如这里的<title>Qt</title>
中的Qt
就是文本内容。
二、使用DOM读取XML文档内容
Dom(Document Object Model,即文档对象模型)把XML文档转换成应用程序可以遍历的树形结构,这样便可以随机访问其中的节点。它的缺点是需要将整个XML文档读入内存,消耗内存较多。
在Qt中使用QDomProcessingInstruction类来表示XML说明,元素对应QDomElement类,属性对应QDomAttr类,文本内容由QDomText类表示。所有的DOM节点,比如这里的说明、元素、属性和文本等,都使用QDomNode来表示,然后使用对应的isProcessingInstruction()、isElement()、isAttr()和isText()等函数来判断是否是该类型的元素,如果是,那么就可以使用toProcessingInstruction()、toElement()、toAttr()和toText()等函数转换为具体的节点类型。
下面来演示一个例子,将读取前面介绍的XML
文档的内容。
QT
+= core xml
然后保存该文件。
#include<QCoreApplication> #include<QtXml> int@H_404_359@main(int@H_404_359@argc,char@H_404_359@*argv[]) @H_404_359@{ QCoreApplication@H_404_359@a(argc,@H_404_359@argv); //新建QDomDocument类对象,它代表一个XML文档 QDomDocument@H_404_359@doc; //建立指向“my.xml”文件的QFile对象 QFile@H_404_359@file("my.xml"@H_404_359@); //以只读方式打开 if@H_404_359@(!file.open(QIODevice@H_404_359@::ReadOnly@H_404_359@))return0@H_404_359@; //将文件内容读到doc中 if@H_404_359@(!doc.setContent(&file)) @H_404_359@ {@H_404_359@file.close();return0@H_404_359@;@H_404_359@} //关闭文件 @H_404_359@ file.close(); //获得doc的第一个节点,即XML说明 QDomNode@H_404_359@firstNode@H_404_359@=@H_404_359@doc.firstChild(); //输出XML说明 @H_404_359@ qDebug()@H_404_359@<<@H_404_359@firstNode.nodeName() @H_404_359@<<@H_404_359@firstNode.nodeValue(); return@H_404_359@a.exec(); }
4.
然后先点击一下Qt Creator
左下角的锤子图标来构建项目,这样会在源码目录旁生成构建目录,比如这里是myDom-build-
桌面-Debug
,我们进入该目录,然后新建一个文本文档,如下图所示。
5.
现在运行程序,效果如下图所示。
如果大家不愿意看到字符串两边的引号,可以将源码中得qDebug()
语句更改如下:
运行程序,效果如下图所示。
//
如果节点不为空
@H_404_359@{
@H_404_359@}
@H_404_359@{
QDomElement
e = n.toElement();
qDebug() << qPrintable(e.tagName())
//
获得元素e的所有子节点的列表
QDomNodeList
list = e.childNodes();
//
遍历该列表
QDomNode
node = list.at(i);
qDebug() << " " << qPrintable(node.toElement().tagName())
@H_404_359@}
结语
通过上面的例子,我们实现了对一个XML文档的读取。可以看到,在QDom中,是将整个XML文件读到内存中的doc对象中的。然后使用节点(QDomNode )操作doc对象,像XML说明,元素,属性,文本等等都被看做是节点,这样就使得操作XML文档变得很简单,我们只需通过转换函数将节点转换成相应的类型,如
QDomElement e =n.toElement();
在下一节我们将讲述XML文件的创建和写入。
涉及到的源码:myDom.zip |