Xml文档的解析
XML解析方式分为两种:DOM方式和SAX方式
DOM:DocumentObjectModel, 文档对象模型。这种方式是W3C推荐的处理XML的一种方式。 SAX:SimpleAPIforXML。 这种方式不是官方标准,属于开源社区XML-DEV,几乎所有的XML解析器都支持它。 XML解析开发包: JAXP:是SUN公司推出的解析标准实现。 Dom4J:是开源组织推出的解析开发包。(牛,大家都在用,包括SUN公司的一些技术的实现都在用) JDom:是开源组织推出的解析开发包。 |
JAXP
JAXP: JAXP:(JavaAPIforXMLProcessing)开发包是JavaSE的一部分,它由以下几个包及其子包组成: org.w3c.dom:提供DOM方式解析XML的标准接口 org.xml.sax:提供SAX方式解析XML的标准接口 javax.xml:提供了解析XML文档的类 javax.xml.parsers包中,定义了几个工厂类。我们可以通过调用这些工厂类,得到对XML文档进行解析的DOM和SAX解析器对象。 DocumentBuilderFactory SAXParserFactory |
提示:javax.xml.parsers包中的DocumentBuilderFactory用于创建DOM模式的解析器对象,DocumentBuilderFactory是一个抽象工厂类,它不能直接实例化,但该类提供了一个newInstance方法,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回
如何获得JAXP中的DOM解析器?
调用DocumentBuilderFactory.newInstance()方法得到创建DOM解析器的工厂。 调用工厂对象的newDocumentBuilder方法得到DOM解析器对象。 调用DOM解析器对象的parse()方法解析XML文档,得到代表整个文档的Document对象,进行可以利用DOM特性对整个XML文档进行操作了。 |
Dom编程入门级别
DOM解析器在解析XML文档时,会把文档中的所有元素,按照其出现的层次关系,解析成一个个Node对象(节点)。 在dom中,节点之间关系如下: 位于一个节点之上的节点是该节点的父节点(parent) 一个节点之下的节点是该节点的子节点(children) 同一层次,具有相同父节点的节点是兄弟节点(sibling) 一个节点的下一个层次的节点集合是节点后代(descendant) 父、祖父节点及所有位于节点上面的,都是节点的祖先(ancestor) |
Node对象总结
Node对象提供了一系列常量来代表结点的类型,当开发人员获得某个Node类型后,就可以把Node节点转换成相应的节点对象(Node的子类对象),以便于调用其特有的方法。(查看API文档) Node对象提供了相应的方法去获得它的父结点或子结点。编程人员通过这些方法就可以读取整个XML文档的内容、或添加、修改、删除XML文档的内容了 |
SAX解析过程:
查看老师的源代码即可
Sax解析的过程
Dom4j解析xml文档:
Dom4j常用操作如下: |
|
/** *返回Document *@return */ publicstaticDocumentgetDocument(){ SAXReaderreader; Documentdocument=null; try{ reader=newSAXReader(); document=reader.read("src/book.xml"); }catch(Exceptione){ e.printStackTrace(); } returndocument; } /** *写回Document到XML文件 *@paramdocument */ publicstaticvoidwriteDocument2XML(Documentdocument){ try{ OutputFormatformat=OutputFormat.createPrettyPrint(); //format.setEncoding("UTF-8"); XMLWriterwriter=newXMLWriter(newFileOutputStream("src/books.xml"),format); writer.write(document); writer.close(); }catch(Exceptione){ e.printStackTrace(); } } |
|
1、得到某个具体的节点内容第二本书的作者 @@H_19_403@Test publicvoidtest1(){ //1.得到Document Documentdocument=Dom4jUtil.getDocument(); //2.得到根结点 Elementroot=document.getRootElement(); //3.第到第二本书elments()element() Listlist=root.elements("书"); ElementeleBook=(Element)list.get(1); //4.找第二本书的作者 //ElementauthorEle=eleBook.element("作者"); ElementauthorEle=(Element)document.selectSingleNode("/书架/书[2]/作者"); //5.找作者所对应的文本 System.out.println(authorEle.getText()); }
|
|
2、遍历所有元素节点 |
|
@Test publicvoidtest2(){ //1.得到Document Documentdocument=Dom4jUtil.getDocument(); //2.得到根结点 Elementroot=document.getRootElement(); //递归调用 treeWalk(root); } publicvoidtreeWalk(Elementelement){ System.out.println(element.getName()); for(inti=0;i<element.nodeCount();i++){ Nodenode=element.node(i); if(nodeinstanceofElement){ treeWalk((Element)node); } } } |
|
//3、修改某个元素节点的主体内容修改第一本书的售价为300 @Test publicvoidtest3(){ //1.得到Document Documentdocument=Dom4jUtil.getDocument(); //2.得到根结点 Elementroot=document.getRootElement(); //3.找到第一本书 ElementfirstBookEle=root.element("书"); //4.找到第一本书的售价 //ElementfirstPriceEle=firstBookEle.element("售价"); //xpath ElementfirstPriceEle=(Element)document.selectSingleNode("//书架/书[1]/售价"); //5.修改 firstPriceEle.setText("3000"); //6.写回 Dom4jUtil.writeDocument2XML(document); } |
|
@@H_19_403@Test publicvoidtest4(){ //1.得到Document Documentdocument=Dom4jUtil.getDocument(); //2.得到根结点 Elementroot=document.getRootElement(); //3.找到第二本书 Listlist=root.elements("书"); ElementeleBook=(Element)list.get(1); //4.追加一个批发价子结点 eleBook.addElement("批发价").setText("20000"); //6.写回 Dom4jUtil.writeDocument2XML(document); } |
|
5、向指定元素节点上增加同级元素节点在第二本书售价前面添加一个内部价结点 @Test publicvoidtest5(){ //1.得到Document Documentdocument=Dom4jUtil.getDocument(); //2.得到根结点 Elementroot=document.getRootElement(); //3.找到第二本书 Listlist=root.elements("书"); ElementeleBook=(Element)list.get(1); //4.添加内部价 ElementinnerPriceEle=DocumentHelper.createElement("内部价"); innerPriceEle.setText("40000"); eleBook.elements().add(2,innerPriceEle);//第三个位置上 //6.写回 Dom4jUtil.writeDocument2XML(document); } |
|
@Test publicvoidtest6(){ //1.得到Document Documentdocument=Dom4jUtil.getDocument(); //2.得到根结点 Elementroot=document.getRootElement(); //3.找到第二本书 Listlist=root.elements("书"); ElementeleBook=(Element)list.get(1); //4.找到内部价 ElementinnerPriceEle=eleBook.element("内部价");
eleBook.remove(innerPriceEle); //6.写回 Dom4jUtil.writeDocument2XML(document); } |
|
//7、操作XML文件属性在第一本书结点中添加一个bid属性 @Test publicvoidtest7(){ //1.得到Document Documentdocument=Dom4jUtil.getDocument(); //2.得到根结点 Elementroot=document.getRootElement(); //3.找到第一本书 ElementfirstBookEle=root.element("书"); firstBookEle.addAttribute("bid","y11"); //6.写回 Dom4jUtil.writeDocument2XML(document); } |
|
Dom4j 是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM的人分离出来而后独立开发的。与JDOM不同的是,dom4j使用接口和抽象基类,虽然Dom4j的API相对要复杂一些,但它提供了比JDOM更好的灵活性。 Dom4j是一个非常优秀的JavaXMLAPI,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j,例如Hibernate,包括sun公司自己的JAXM也用了Dom4j。 使用Dom4j开发,需下载dom4j相应的jar文件。 Document对象 |
|
DOM4j中,获得Document对象的方式有三种: 1.读取XML文件,获得document对象 SAXReaderreader=newSAXReader(); 2.解析XML形式的文本,得到document对象. Stringtext="<members></members>"; 3.主动创建document对象. Documentdocument=DocumentHelper.createDocument(); Elementroot=document.addElement("members");
|
|
节点对象 |
|
1.获取文档的根节点 |
Elementroot=document.getRootElement(); |
2.取得某个节点的子节点 |
Elementelement=node.element(“书名") |
3.取得节点的文字 |
Stringtext=node.getText(); |
4.取得某节点下所有名为“member”的子节点,并进行遍历. |
Listnodes=rootElm.elements("member"); |
5.对某节点下的所有子节点进行遍历. |
for(Iteratorit=root.elementIterator();it.hasNext();){ |
6.在某节点下添加子节点 |
ElementageElm=newMemberElm.addElement("age"); |
7.设置节点文字. |
element.setText("29"); |
8.删除某节点. |
parentElm.remove(childElm); |
9.添加一个CDATA节点. |
ElementcontentElm=infoElm.addElement("content"); |
节点对象属性
|
|
1.取得某节点下的某属性 |
Attributeattribute=root.attribute("size"); |
Stringtext=attribute.getText(); |
|
Attributeattribute=root.attribute("size"); |
|
3.遍历某节点的所有属性 |
for(Iteratorit=root.attributeIterator();it.hasNext();){ |
newMemberElm.addAttribute("name","sitinspring"); |
|
Attributeattribute=root.attribute("name"); |
|
将文档写入XML文件. |
1.文档中全为英文,不设置编码,直接写入的形式.
2.文档中含有中文,设置编码格式写入的形式. format.setEncoding("GBK"); |
字符串和xml文档之间的转换 |
1.将字符串转化为XML Stringtext="<members><member>sitinspring</member></members>";
2.将文档或节点的XML转化为字符串. SAXReaderreader=newSAXReader();
StringrootXmlText=root.asXML(); |