在解析xml时(如浏览器解析html标签),主要存在两种方式:SAX模式和DOM模式
SAX (Simple API for XML)和DOM (Document Object Model)是当前两个主要的XML API,几乎所有商用的xml解析器都同时实现了这两个接口。因此如果你的程序使用了SAX或者DOM APIs,那么你的程序对xml解析器是透明。
SAX | DOM |
依序读入文件并产生相对应事件,可以处理任何大小的XML文件。 | 在内存中建立文件树,不适于处理大型的XML文件。 |
只能对文件按顺序剖析一遍,不支持对文件的随意存取 | 可以随意存取文件树的任何部分,没有次数限制 |
只能读取XML文件内容,而不能修改 | 可以随意修改文件树,从而修改了XML文件 |
开发上比较复杂,需要自己来制作事件处理器 | 易于理解,易于开发 |
对工作人员更灵活,可以用SAX建立自己的XML对象模型 | 已经在DOM基础之上建立了文件树 |
@H_403_103@
基于事件的处理的优点和缺点
这种处理的优点非常类似于流媒体的优点。分析能够立即开始,而不是等待所有的数据被处理。而且,由于应用程序只是在读取数据时检查数据, @H_403_103@
这种处理的优点非常类似于流媒体的优点。分析能够立即开始,而不是等待所有的数据被处理。而且,由于应用程序只是在读取数据时检查数据, @H_403_103@
因此不需 要将数据存储在内存中。这对于大型文档来说是个巨大的优点。事实上,应用程序甚至不必解析整个文档;它可以在某个条件得到满足时
@H_403_103@
停止解析。一般来说,
SAX
还比它的替代者
DOM
快许多。
另一方面,由于应用程序没有以任何方式存储数据,使用 SAX 来更改数据或在数据流中往后移是不可能的。 @H_403_103@
另一方面,由于应用程序没有以任何方式存储数据,使用 SAX 来更改数据或在数据流中往后移是不可能的。 @H_403_103@
@H_403_103@
基于树的处理的优点和缺点
@H_403_103@
DOM @H_403_103@ 以及广义的基于树的处理具有几个优点。首先,由于树在内存中是持久的,因此可以修改它以便应用程序能对数据和结构作出更改。
DOM @H_403_103@ 以及广义的基于树的处理具有几个优点。首先,由于树在内存中是持久的,因此可以修改它以便应用程序能对数据和结构作出更改。
它还可以在任何时候在树中上下导航,而不是像
SAX
那样是一次性的处理。
DOM
使用起来也要简单得多。
另一方面,在内存中构造这样的树涉及大量的开销。大型文件完全占用系统内存容量的情况并不鲜见。此外,创建一棵 DOM 树可能是一个缓慢的过程。 @H_403_103@
另一方面,在内存中构造这样的树涉及大量的开销。大型文件完全占用系统内存容量的情况并不鲜见。此外,创建一棵 DOM 树可能是一个缓慢的过程。 @H_403_103@
@H_403_103@
如何在SAX和DOM之间选择
@H_403_103@ 选择DOM还是选择SAX,这取决于下面几个因素:
1. 应用程序的目的:如果打算对数据作出更改并将它输出为 XML ,那么在大多数情况下, DOM 是适当的选择。并不是说使用 SAX 就不能更改数据, @H_403_103@
@H_403_103@ 选择DOM还是选择SAX,这取决于下面几个因素:
1. 应用程序的目的:如果打算对数据作出更改并将它输出为 XML ,那么在大多数情况下, DOM 是适当的选择。并不是说使用 SAX 就不能更改数据, @H_403_103@
但是该过程要复杂得多,因为您必须对数据的一份拷贝而不是对数据本身作出更改。
@H_403_103@
2. 数据容量: 对于大型文件, SAX 是更好的选择。
数据将如何使用:如果只有数据中的少量部分会被使用,那么使用 SAX 来将该部分数据提取到应用程序中可能更好。 另一方面, @H_403_103@
2. 数据容量: 对于大型文件, SAX 是更好的选择。
数据将如何使用:如果只有数据中的少量部分会被使用,那么使用 SAX 来将该部分数据提取到应用程序中可能更好。 另一方面, @H_403_103@