这篇文章主要介绍了JAVA DOM解析XML文件过程详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
代码如下
import java.io.IOException; import javax.xml.parsers.*; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.NamedNodeMap; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import org.xml.sax.SAXException; public class Domtest { public static void main(String[] args) throws ParserConfigurationException,SAXException,IOException { //创建一个DocumentBuilderFactory对象 DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance(); //创建一个Doucumentbuild对象 DocumentBuilder db=dbf.newDocumentBuilder(); //解析对应的xml文件 Document doc=db.parse("tes.xml"); //根据标签名获取Node节点list NodeList nodelist=doc.getElementsByTagName("book"); System.out.println("共有"+nodelist.getLength()+"本书"); //遍历每一个book节点 for(int i=0;i<nodelist.getLength();i++) { System.out.println("第"+i+"本书"); //获取个book节点 //使用Node类型获取book Node book=nodelist.item(i); System.out.println("Name: "+book.getNodeName()+" Value: "+book.getNodeValue()+" Type: "+book.getNodeType()); //获取Node节点中的属性 NamedNodeMap attrs= book.getAttributes(); //遍历获取属性 for(int j=0;j<attrs.getLength();j++) { Node x=attrs.item(j); //System.out.println(x.getNodeName()+" "+x.getNodeValue()+" "+x.getNodeType()); } //使用Element对象获取节点 Element node =(Element) nodelist.item(i); //使用Element对象下的getAttribute方法可以获取指定名字的属性值 String id=node.getAttribute("id"); System.out.println(id); String type=node.getAttribute("type"); System.out.println(type); //使用Node节点下的getChildNode可以获取Nodelist数组,以此进行循环解析 NodeList childnode=book.getChildNodes(); for(int j=0;j<childnode.getLength();j++) {//getLength后会获取9个节点,因为text类型也算节点,一个<name>……</name>算一个节点,所以共有9个节点,而这些节点中,只有对象节点是我们需要的 Node x=childnode.item(j); if(x.getNodeType()==Node.ELEMENT_NODE){//当节点类型为Element时,获取该节点 //获取element类型的节点名 System.out.println("节点"+j+"的名字:"+x.getNodeName()+" 值:/"+x.getLastChild().getNodeValue()+"/种类为"+x.getLastChild().getNodeType());//<name>xyz<name>,xyz属于<name>的子节点,使用getfirstChild或getLastNode效果相同 System.out.println("节点"+j+"的名字:"+x.getNodeName()+" 值:/"+x.getTextContent()+"/种类为"+x.getNodeType());//getTextContent方法可以获取节点中所有的text内容 将<name>xyz</name>改为<name><a>123</a>xyz</name>,会获取到xyz123 } } } } } //为了将获取到的xml文件中内容保存下来,可以将内容保存到对象数组中一次来存储数据
<?xml version="1.0" encoding="UTF-8" ?> <Bookstore> <book id="1" type="text"> <name>冰与火之歌</name> <author>乔治马丁</author> <year>2014</year> <price>80</price> </book> <book id="2"> <name>安徒生童话</name> <year>2004</year> <price>79</price> <language>English</language> </book> </Bookstore>
注意点
1 空白换行符也算节点,所以遍历节点时需要注意这些无用的节点会混在list中
2 text类节点返回Name值都是#text,而Element类节点返回value值都是null,需要注意