转载:http://www.jb51.cc/article/p-usmwxyyk-pb.html
DOM方式是直接把xml文件全部加载到内存,然后建立dom树,特点:可读可写,支持XPath,但是非常慢,占用内存为xml的10倍数量级,无法处理大文件。
SAX方式则是事件通知机制,一点点的处理xml,每分析一个节点,调用用户自己实现的处理逻辑,特点:非常快,几乎不占用内存,只能读,并且只能读一次,不能读取指定内容也不能重复读,API也比dom难用的多。
VTD-XML则兼容了这两个xml处理技术的优势,其先按二进制方式扫描一遍xml文件,针对所有的节点做一个二进制索引,这个需要的内存量只有xml的1-1.5倍。然后读操作,只需要从索引找到offset即可。VTD-XML的XPath实现也基于这种原理,所以非常快。
相对sax:可读可以修改,可随机读和重复读,
相对dom:占用内存是xml的一倍多,而dom一般是10倍,支持高速的xpath表达式,这个相当赞
VTD-XML的处理效率是DOM的几十倍:http://vtd-xml.sourceforge.net/benchmark1.html
项目地址:http://vtd-xml.sourceforge.net/
原理介绍:http://vtd-xml.sourceforge.net/DevGuide/0.html