在解析xml时(如浏览器解析html标签),主要存在两种方式:SAX模式和DOM模式
SAX (Simple API for XML)和DOM (Document Object Model)是当前两个主要的XML API,几乎所有商用的xml解析器都同时实现了这两个接口。因此如果你的程序使用了SAX或者DOM APIs,那么你的程序对xml解析器是透明。
SAX | DOM |
依序读入文件并产生相对应事件,可以处理任何大小的XML文件。 | 在内存中建立文件树,不适于处理大型的XML文件。 |
只能对文件按顺序剖析一遍,不支持对文件的随意存取 | 可以随意存取文件树的任何部分,没有次数限制 |
只能读取XML文件内容,而不能修改 | 可以随意修改文件树,从而修改了XML文件 |
开发上比较复杂,需要自己来制作事件处理器 | 易于理解,易于开发 |
对工作人员更灵活,可以用SAX建立自己的XML对象模型 | 已经在DOM基础之上建立了文件树 |
基于事件的处理的优点和缺点
这种处理的优点非常类似于流媒体的优点。分析能够立即开始,而不是等待所有的数据被处理。而且,由于应用程序只是在读取数据时检查数据,
DOM
以及广义的基于树的处理具有几个优点。首先,由于树在内存中是持久的,因此可以修改它以便应用程序能对数据和结构作出更改。
如何在SAX和DOM之间选择
选择DOM还是选择SAX,这取决于下面几个因素:
这种处理的优点非常类似于流媒体的优点。分析能够立即开始,而不是等待所有的数据被处理。而且,由于应用程序只是在读取数据时检查数据,
因此不需 要将数据存储在内存中。这对于大型文档来说是个巨大的优点。事实上,应用程序甚至不必解析整个文档;它可以在某个条件得到满足时
停止解析。一般来说,
SAX
还比它的替代者
DOM
快许多。
另一方面,由于应用程序没有以任何方式存储数据,使用 SAX 来更改数据或在数据流中往后移是不可能的。
另一方面,由于应用程序没有以任何方式存储数据,使用 SAX 来更改数据或在数据流中往后移是不可能的。
基于树的处理的优点和缺点
DOM
它还可以在任何时候在树中上下导航,而不是像
SAX
那样是一次性的处理。
DOM
使用起来也要简单得多。
另一方面,在内存中构造这样的树涉及大量的开销。大型文件完全占用系统内存容量的情况并不鲜见。此外,创建一棵 DOM 树可能是一个缓慢的过程。
另一方面,在内存中构造这样的树涉及大量的开销。大型文件完全占用系统内存容量的情况并不鲜见。此外,创建一棵 DOM 树可能是一个缓慢的过程。
但是该过程要复杂得多,因为您必须对数据的一份拷贝而不是对数据本身作出更改。
如果您知道自己以后会回头引用已处理过的大量信息,那么
SAX
也许不是恰当的选择。
3.对速度的需要:SAX实现通常要比DOM实现更快。
SAX和DOM不是相互排斥的,记住这点很重要。您可以使用DOM来创建SAX事件流,也可以使用SAX来创建DOM树。事实上,用于创建DOM树的大多数解析器实际上都使用SAX来完成这个任务!
原文链接:http://www.cnblogs.com/zhulin/archive/2012/05/03/2480962.html