TinyXML-2解析XML数据

前端之家收集整理的这篇文章主要介绍了TinyXML-2解析XML数据前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

声明

本文例子源自在C++中使用TinyXML2解析xml一文,其余部分来源于网络搜集,难免疏漏,敬请随意吐槽。

XML以及JSON

什么是XML


根据Wikipedia-XML的说法:

可扩展标记语言(英语:eXtensible Markup Language,简称:XML),是一种标记语言。标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。如何定义这些标记,既可以选择国际通用的标记语言,比如HTML,也可以使用像XML这样由相关人士自由决定的标记语言,这就是语言的可扩展性。XML是从标准通用标记语言(SGML)中简化修改出来的。它主要用到的有可扩展标记语言、可扩展样式语言(XSL)、XBRL和XPath等。
XML设计用来传送及携带数据信息,不用来表现或展示数据,所以XML用途的焦点是它说明数据是什么,以及携带数据信息。

我个人对XML了解不多,这次使用也是用来保存机器学习生成的模型,感觉上用XML来传输存储信息是很方便的。

@H_301_19@XML和JSON

JSON是另一种可以用来传输货保存信息的格式。根据Wikipedia-JSON的说法:

JSON(JavaScript Object Notation)是一种由道格拉斯·克罗克福特构想设计、轻量级的资料交换语言,以文字为基础,且易于让人阅读。尽管JSON是Javascript的一个子集,但JSON是独立于语言的文本格式,并且采用了类似于C语言家族的一些习惯。

关于XML和JSON的比较,Wikipedia上如是说:

JSON与XML最大的不同在于XML是一个完整的标记语言,而JSON不是。这使得XML在程式判读上需要比较多的功夫。主要的原因在于XML的设计理念与JSON不同。XML利用标记语言的特性提供了绝佳的延展性(如XPath),在数据存储,扩展及高级检索方面具备对JSON的优势,而JSON则由于比XML更加小巧,以及浏览器的内建快速解析支持,使得其更适用于网络数据传输领域。

关于这一问题,在国内的知乎上也有各种讨论,比如:《为什么XML这么笨重的数据结构仍在广泛应用》《为什么都反对 XML 而支持使用 JSON》。总结下来,基本也就是各有优势,具体选择还是需要根据需要判断。

XML解析库

各种语言都有XML的解析方案,Java和Python都有方便的解析库。对于C++也有多种解析方案,可以参考《C++解析xml有什么好用的轮子》《What XML parser should I use in C++?》。也有人做了一张图:

我最终选择了TinyXML2,使用挺方便简单。

话说Json似乎有个RapidJSON很好用(传说、传说而已),有空可以尝试一下。

TinyXML2

配置TinyXML2

TinyXML是一个C++的开源解析XML的解析库,根据TinyXML下载页面的介绍:

TinyXML is a simple,small,minimal,C++ XML parser that can be easily integrating into other programs. It reads XML and creates C++ objects representing the XML document. The objects can be manipulated,changed,and saved again as XML.

TinyXML已经停止开发了,现在推荐使用后续版本TinyXML2。

XinyXML2的文档:TinyXML2 Documentation
下载页面在GitHub上:leethomason/tinyxml2

使用的时候只需把项目下载下来,解压,把tinyxml2.h和tinyxml2.cpp拷到工程目录里。使用的时候加入#include"tinyxml2.h"即可。

TinyXML2使用

TinyXML2的使用可以参考TinyXML2 Documentation以及在C++中使用TinyXML2解析xml

TinyXML读取文件

使用TinyXML2读取文件可以使用:

XMLDocument doc;
doc.LoadFile( "resources/dream.xml" );

TinyXML解析XML字符串

使用TinyXML2解析内存中XML字符串可以使用:

static const char* xml = "<element/>"; //XML字符串
XMLDocument doc;
doc.Parse( xml );//解析XML字符串

TinyXML解析XML数据

在从文件或者字符串中取得XML数据之后,可以使用TinyXML2进行解析。

首先说明几个我用到的函数

//获取DOM的根元素,等同于FirstChildElement()
XMLElement* tinyxml2::XMLDocument::RootElement()

//取得第一个子元素(使用默认参数),或者根据const char * value的值获取第一个name等同value的子元素
const XMLElement* tinyxml2::XMLNode::FirstChildElement( const char * value = 0 ) const

//返回第一个子结点,如果不存在则返回null
const XMLNode *FirstChild () const

//根据valude返回当前node的下一名为valude的元素
const XMLElement * NextSiblingElement (const char *value=0) const

//返回列表中下一属性
const XMLAttribute * Next () const

//返回属性的名字,如<scene name="Depth">中name="Depth"为属性,其名字为name
const char * Name () const

//返回列表第一个属性值如<scene name="Depth">中name="Depth"为属性,其值为Depth
const XMLAttribute *FirstAttribute () const

//方便的访问元素内容函数,如元素为<foo>This is text</foo>,则返回指向字符串"This is text"的指针。
const char* tinyxml2::XMLElement::GetText() const

具体例子参考在C++中使用TinyXML2解析xml,假设XML内容如下:

<?xml version="1.0"?>  
<scene name="Depth">  
    <node type="camera">  
        <eye>0 10 10</eye>  
        <front>0 0 -1</front>  
        <refUp>0 1 0</refUp>  
        <fov>90</fov>  
    </node>  
    <node type="Sphere">  
        <center>0 10 -10</center>  
        <radius>10</radius>  
    </node>  
    <node type="Plane">  
        <direction>0 10 -10</direction>  
        <distance>10</distance>  
    </node>  
</scene>

对其进行测试代码

#include <iostream>
#include <string> 

#include"tinyxml2.h" 

using namespace std;

int main()  
{  
    tinyxml2::XMLDocument doc;  
    doc.LoadFile("test.xml");  

    tinyxml2::XMLElement *scene=doc.RootElement();   
    tinyxml2::XMLElement *surface=scene->FirstChildElement("node");  
    while (surface)  
    {  
        tinyxml2::XMLElement *surfaceChild=surface->FirstChildElement();  
        const char* content;  
        const tinyxml2::XMLAttribute *attributeOfSurface = surface->FirstAttribute();  
        cout<< attributeOfSurface->Name() << ":" << attributeOfSurface->Value() << endl;  
        while(surfaceChild)  
        {  
            content=surfaceChild->GetText();  
            surfaceChild=surfaceChild->NextSiblingElement();  
            cout<<content<<endl;  
        }  
        surface=surface->NextSiblingElement();  
    }   
    return 0;  
}

输出结果为:

需要注意的是:
GetText()的使用仅限于<foo>This is text</foo>类型元素。对于<foo><b>This is text</b></foo>类型结果会null,<foo>This is <b>text</b></foo>类型结果为”This is “。更为安全的访问元素的方法是使用形如一下的方法

XMLText* textNode = titleElement->FirstChild()->ToText();
title = textNode->Value();
printf( "Name of play (2): %s\n",title );

总结

以上就是一些TinyXML-2解析XML数据的简单介绍,之前想写的很多,写上才发现很多东西因为理解不够所以表述不清,只希望在作为自己的记录的同时,能够给刚刚接触TinyXML2的人一些简单的介绍,如有更多需求请参考官方文档。

Reference

猜你在找的XML相关文章