SAX和DOM解析XML区别
@H_502_5@选择DOM与SAX,与在一个数据库中的表单与视图之前选择一样:选择适合于当前实际情况的方法。如果你只是想简单地查看XML文档而不处理它,那么请选择使用SAX。
SAX与DOM之间的区别
SAX与DOM之间有一些显著区别,包括:
DOM是复杂对象处理的首选,比如当XML比较复杂的时候,或者当你需要随机处理文档中数据的时候。SAX从文档的开始通过每一节点移动,以定位一个特定的节点。
DOM为载入到内存的文档节点建立类型描述。最终,这些描述呈现了可容易横向移动、潜在巨大、树型结构。如果XML很冗长,DOM就会显示出无法控制的胀 大。例如,一个300KB的XML文档可以导致RAM或者虚拟内存中的3,000,000KB的DOM树型结构。通过比较就会发现,一个SAX文档根本就 没有被解构,它也没有隐藏在内存空间中(当然当XML流被读入时,会有部分文档暂时隐藏在内存中)。SAX就是一种“更轻巧的”技术──它可以给你的系统 带来更轻的负担。SAX相当于观看一场马拉松比赛,而DOM就好比邀请所有的比赛选手到家里参加晚餐。
所以,你如何选择SAX和DOM?如果你处理复杂的东西,比如高级XSLT转换,或者Xpath过滤,请选择使用DOM。如果你建立或者更改XML文档,你也可以选择DOM。
相反,你可以使用SAX来查询或者阅读XML文档。SAX可以快速扫描一个大型的XML文档,当它找到查询标准时就会立即停止,然后再处理之。
在某些情况下,在一个方案中,最佳的选择是使用DOM和SAX处理不同的部分。例如,你可以使用DOM将XML载入到内存并改变它,然后通过从DOM树中发送一个SAX流而转移最后的结果。
SAX概念
SAX是Simple API for XML的缩写,它并不是由W3C官方所提出的标准,可以说是“民间”的事实标准。实际上,它是一种社区性质的讨论产物。虽然如此,在XML中对SAX的应用丝毫不比DOM少,几乎所有的XML解析器都会支持它。
与DOM比较而言,SAX是一种轻量型的方法。我们知道,在处理DOM的时候,我们需要读入整个的XML文档,然后在内存中创建DOM树,生成 DOM树上的每个Node对象。当文档比较小的时候,这不会造成什么问题,但是一旦文档大起来,处理DOM就会变得相当费时费力。特别是其对于内存的需 求,也将是成倍的增长,以至于在某些应用中使用DOM是一件很不划算的事(比如在applet中)。这时候,一个较好的替代解决方法就是SAX。
SAX在概念上与DOM完全不同。首先,不同于DOM的文档驱动,它是事件驱动的,也就是说,它并不需要读入整个文档,而文档的读入过程也就是 SAX的解析过程。所谓事件驱动,是指一种基于回调(callback)机制的程序运行方法。(如果你对Java新的代理事件模型比较清楚的话,就会很容 易理解这种机制了)
在XMLReader接受XML文档,在读入XML文档的过程中就进行解析,也就是说读入文档的过程和解析的过程是同时进行的,这和DOM区别很 大。解析开始之前,需要向XMLReader注册一个ContentHandler,也就是相当于一个事件监听器,在ContentHandler中定义 了很多方法,比如startDocument(),它定制了当在解析过程中,遇到文档开始时应该处理的事情。当XMLReader读到合适的内容,就会抛 出相应的事件,并把这个事件的处理权代理给ContentHandler,调用其相应的方法进行响应
importjava.io.FileInputStream;
importjava.io.FileNotFoundException;
importjava.io.IOException;
importjava.io.InputStream;
importjavax.xml.parsers.DocumentBuilder;
xml.parsers.DocumentBuilderFactory;
xml.parsers.ParserConfigurationException;
importorg.w3c.dom.Document;
importorg.w3c.dom.Element;
dom.Node;
dom.NodeList;
importorg.xml.sax.SAXException;
publicclassDOMParsePage {
publicDOMParsePage() {
DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance();
try{
DocumentBuilder dombuilder=domfac.newDocumentBuilder();
InputStream is=newFileInputStream("C:/123.xml"@H_502_117@);
Document doc=dombuilder.parse(is);
Element root=doc.getDocumentElement();
NodeList books=root.getChildNodes();
if(books!=null){
for(inti=0;i<books.getLength();i++){
Node book=books.item(i);
for(Node node=book.getFirstChild();node!=null;node=node.getNextSibling())
{
if(node.getNodeType()==Node.ELEMENT_NODE){
if(node.getNodeName().equals(@H_502_117@"title"@H_502_117@)){
Stringbookname=node.getFirstChild().getNodeValue();
System.out.println(bookname);
}
@H_502_117@"author"@H_502_117@Stringauthor1=node.getFirstChild().getNodeValue();
System.out.println(author1);
}
@H_502_117@"description"@H_502_117@Stringaddtime=node.getFirstChild().getNodeValue();
System.out.println(addtime);
}
@H_502_117@"pubDate"Stringprice=node.getFirstChild().getNodeValue();
System.out.println(price);
}
}
}
}
}
}
catch(ParserConfigurationException e) {
e.printStackTrace();
}
catch(FileNotFoundException e) {
e.printStackTrace();
}
catch(SAXException e) {
e.printStackTrace();
}
catch(IOException e) {
e.printStackTrace();
}
}
staticvoidmain(String[] args) {
newDOMParsePage();
}
}
SAX解析XML package simpleTest; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.Locator; import org.xml.sax.ContentHandler; import org.xml.sax.InputSource; import org.xml.sax.helpers.DefaultHandler; import java.io.IOException; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; class TestSAX extends DefaultHandler { private StringBuffer buf; public TestSAX() { super(); } public void setDocumentLocator(Locator locator) { } public void startDocument() throws SAXException { buf=new StringBuffer(); System.out.println("*******开始解析文档*******"); } public void endDocument() throws SAXException { System.out.println("*******文档解析结束*******"); } public void startPrefixMapping( String prefix,String uri ) { System.out.println("/n前缀映射: " + prefix +" 开始!"+ " 它的URI是:" + uri); } public void endPrefixMapping( String prefix ) { System.out.println("/n前缀映射: "+prefix+" 结束!"); } public void processingInstruction( String target,String instruction ) throws SAXException { } public void ignorableWhitespace( char[] chars,int start,int length ) throws SAXException { } public void skippedEntity( String name ) throws SAXException { } public void startElement(String namespaceURI,String localName,String qName,Attributes atts) { System.out.println("*******开始解析元素*******"); System.out.println("元素名"+qName); for(int i=0;i<atts.getLength();i++) { System.out.println("元素名"+atts.getLocalName(i)+"属性值"+atts.getValue(i)); } } public void endElement(String namespaceURI,String fullName )throws SAXException { System.out.println("******元素解析结束********"); } public void characters( char[] chars,int length )throws SAXException { //将元素内容累加到StringBuffer中 buf.append(chars,start,length); } public static void main(String args[]) { try{ SAXParserFactory sf = SAXParserFactory.newInstance(); SAXParser sp = sf.newSAXParser(); TestSAX testsax=new TestSAX(); sp.parse(new InputSource("D://test//simpleTest//classes//simpleTest//test.xml"),testsax); }catch(IOException e) { e.printStackTrace(); }catch(SAXException e) { e.printStackTrace(); }catch(Exception e) { e.printStackTrace(); } } } XML文件如下: <?xml version="1.0" encoding="gb2312"?> <row> <person> <name>王小明</name> <college>信息学院</college> <telephone>6258113</telephone> <notes>男,1955年生,博士,95年调入海南大学</notes>
@H_502_5@