XML解析方式分为两种:DOM和SAX
DOM :(Document Object Model 即对文章对象模型)是W3C组织推荐处理XML的一种方式。
DOM解析XML的每个元素都会变成对象,并且按照XML文档关系建立起对象的关系,DOM中整个XML文档是Document对象来表示,用Element表示标签对象属性解析成attribute对象。DOM解析方式是预先将整个XML文档全部节点加载到内存中,然后进行读取。并且可以对XML文档进行增删查改。如果文件比较大,则加载速度慢,并且加载过后极易导致内存溢出。
SAX :(Simple API for XML)不是官方标准 ,但他是XML社区的标准,几乎所有XML解析器都支持他。SAX的解析规则是按行对XML文档进行解析,读取一行,解析一行。解析速度比较快,但是也仅仅只能对文档进行读取,并不支持修改。
XML解析器:
Crimson(sun)
Xerces(IBM)
Aelfred2(dom4j)
XML解析包
JAXP(JAVA 官方API)
JDOM(解析效率最低)
DOM4J(解析效率最高,最快)
通过以上对解析方式的比较,下面开始简单介绍一下解析XML文档的过程:
1.读取解析器工厂
2.产生解析器
3.解析XML,使用解析器,产生Document对象实现对XML的解析。