<?xml version= "1.0" encoding = "UTF-8"> <articles> <article category="xml"> <title>XML概述</title> <author>Jerry</author> <email>jerry@yahoo.com</email> <date>2014-10-20</date> </article> </articles>DOM解析(DocumentObject Mode)是一种基于对象的API,它把XML的内容加载到内存中,生成一个与XML文档内容对应的对象模型。当解析完成后,内存中会生成一个对应的DOM树
XML解析只负责解析正确的XML,而不负责判断XML是否合法,如果不合法,会直接抛出解析异常
import java.io.File; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.Node; import org.w3c.dom.NodeList; public class DomParser{ public static void main(String [] args){ File xmlFile = new ("E:\\article.xml"); DocumentBuilder builder = null; DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance(); try{ builder = builderFactory.newDocumentBuilder(); Document document = builder.parse(xmlFile); Element root = document.getDocumentElement(); System.out.println("根元素:"+root.getNodeName()); NodeList childNodes = root.getChildNodes(); for(int i =0;i<childNodes.getLength();i++){ Node node =childNodes.item(i); if(“article”.equals(node.getNodeName())){ System.out.println("文章所属分类:"+node.getAttributes().getNamedItem("category").getNodeValue()); NodeListnodeDetail = node.getChildNodes(); for(intj=0;j< nodeDetail.getLength();j++){ Nodedetail = nodeDetail.item(j); if("title".equals(detail.getNodeName())) System.out.println("标题:"+detail.getTextContenet()); elseif("author".equals(detail.getNodeName())) System.out.println("作者:"+detail.getTextContenet()); elseif("email".equals(detail.getNodeName())) System.out.println("电子邮件:"+detail.getTextContenet()); elseif("date".equals(detail.getNodeName())) System.out.println("日期:"+detail.getTextContenet()); } } } }catch(Exception e){ e.printStackTrace(); } } }
Node对象
Node appendChild(Node newChild)
将节点 newChild 添加到此节点的子节点列表的末尾。
Node cloneNode(booleandeep)
返回此节点的副本,即允当节点的一般复制构造方法。
short compareDocumentPosition(Nodeother)
就节点在文档中的位置并按照文档的顺序,比较引用节点(即在其上调用此方法的节点)与作为参数传递的节点。
NamedNodeMap getAttributes()
包含此节点的属性的NamedNodeMap(如果它是 Element);否则为 null。
String getBaseURI()
此节点的绝对基 URI;如果实现不能获得绝对URI,则为 null。
NodeList getChildNodes()
包含此节点的所有子节点的 NodeList。
Object getFeature(Stringfeature,String version)
此方法返回一个特定的对象,该对象实现指定功能或版本的特定 API,如下所述。
Node getFirstChild()
此节点的第一个子节点。
Node getLastChild()
此节点的最后一个节点。
String getLocalName()
返回此节点限定名称的本地部分。
String getNamespaceURI()
此节点的名称空间 URI;如果它未被指定,则返回null(参见)。
Node getNextSibling()
直接在此节点之后的节点。
String getNodeName()
此节点的名称,取决于其类型;参见上表。
short getNodeType()
表示基础对象的类型的节点,如上所述。
String getNodeValue()
此节点的值,取决于其类型;参见上表。
Document getOwnerDocument()
与此节点相关的 Document 对象。
Node getParentNode()
此节点的父节点。
String getPrefix()
此节点的名称空间前缀;如果它未被指定,则为null。
Node getPrevIoUsSibling()
直接在此节点之前的节点。
String getTextContent()
Object getUserData(Stringkey)
检索与此节点上的某个键相关联的对象。
boolean hasAttributes()
返回此节点(如果它是一个元素)是否具有任何属性。
boolean hasChildNodes()
返回此节点是否具有任何子节点。
Node insertBefore(NodenewChild,Node refChild)
在现有子节点 refChild 之前插入节点newChild。
boolean isDefaultNamespace(StringnamespaceURI)
此方法检查指定的 namespaceURI是否是默认名称空间。
boolean isEqualNode(Nodearg)
测试两个节点是否相等。
boolean isSameNode(Nodeother)
返回此节点是否是与给定节点相同的节点。
boolean isSupported(Stringfeature,String version)
测试 DOM 实现是否实现特定功能,且该功能是否受此节点支持,如下所述。
String lookupNamespaceURI(Stringprefix)
从此节点开始,查找与给定前缀相关的名称空间URI。
String lookupPrefix(StringnamespaceURI)
从此节点开始,查找与给定名称空间 URI 相关的前缀。
void normalize()
将此 Node 之下完整的深层子树中所有Text 节点(包括属性节点)放入只有结构(如元素、注释、处理指令、CDATA 节和实体引用)分隔 Text 节点的“常规”形式,也就是说,既没有相邻的 Text 节点,也没有空 Text 节点。
Node removeChild(NodeoldChild)
从子节点列表中移除 oldChild 所指示的子节点,并将其返回。
Node replaceChild(NodenewChild,Node oldChild)
将子节点列表中的子节点 oldChild 替换为 newChild,并返回 oldChild节点。
void setNodeValue(StringnodeValue)
此节点的值,取决于其类型;参见上表。
void setPrefix(Stringprefix)
此节点的名称空间前缀;如果未指定,则为null。
void setTextContent(StringtextContent)
Object setUserData(Stringkey,Object data,UserDataHandler handler)
将对象与此节点上的键相关联。
Document对象
Node adoptNode(Node source)
试图把另一文档中的节点采用到此文档。
Attr createAttribute(Stringname)
创建给定名称的 Attr。
Attr createAttributeNS(StringnamespaceURI,String qualifiedName)
CDATASection createCDATASection(Stringdata)
创建其值为指定字符串的CDATASection 节点。
Comment createComment(Stringdata)
创建给定指定字符串的 Comment 节点。
DocumentFragment createDocumentFragment()
创建空 DocumentFragment 对象。
Element createElement(StringtagName)
创建指定类型的元素。
Element createElementNS(StringnamespaceURI,String qualifiedName)
EntityReference createEntityReference(String name)
创建 EntityReference 对象。
ProcessingInstruction createProcessingInstruction(String target,String data)
创建给定指定名称和数据字符串的ProcessingInstruction 节点。
Text createTextNode(Stringdata)
创建给定指定字符串的 Text 节点。
DocumentType getDoctype()
与此文档相关的文档类型声明(参见DocumentType)。
Element getDocumentElement()
这是一种便捷属性,该属性允许直接访问文档的文档元素的子节点。
String getDocumentURI()
文档的位置,如果未定义或 Document是使用 DOMImplementation.createDocument 创建的,则为 null。
DOMConfiguration getDomConfig()
调用Document.normalizeDocument() 时使用的配置。
Element getElementById(StringelementId)
返回具有带给定值的 ID 属性的 Element。
NodeList getElementsByTagName(Stringtagname)
按文档顺序返回包含在文档中且具有给定标记名称的所有 Element 的 NodeList。
NodeList getElementsByTagNameNS(StringnamespaceURI,String localName)
以文档顺序返回具有给定本地名称和名称空间URI 的所有 Elements 的 NodeList。
DOMImplementation getImplementation()
处理此文档的DOMImplementation 对象。
String getInputEncoding()
指定解析时此文档使用的编码的属性。
boolean getStrictErrorChecking()
String getXmlEncoding()
作为 XML 声明的一部分,指定此文档编码的属性。
boolean getXmlStandalone()
作为 XML 声明的一部分,指定此文档是否为独立文档的属性。
String getXmlVersion()
作为 XML 声明 的一部分指定此文档版本号的属性。
Node importNode(NodeimportedNode,boolean deep)
从另一文档向此文档导入节点,而不改变或移除原始文档中的源节点;此方法创建源节点的一个新副本。
void normalizeDocument()
此方法的行为如同使文档通过一个保存和加载的过程,而将其置为 "normal(标准)" 形式。
Node renameNode(Noden,String namespaceURI,String qualifiedName)
重命名 ELEMENT_NODE 或ATTRIBUTE_NODE 类型的现有节点。
void setDocumentURI(StringdocumentURI)
文档的位置,如果未定义或 Document是使用 DOMImplementation.createDocument 创建的,则为 null。
void setStrictErrorChecking(booleanstrictErrorChecking)
void setXmlStandalone(booleanxmlStandalone)
作为 XML 声明 的一部分指定此文档是否是单独的的属性。
void setXmlVersion(StringxmlVersion)
作为 XML 声明 的一部分指定此文档版本号的属性。
Attr对象
String getName()
Element getOwnerElement()
此属性连接到的 Element 节点;如果未使用此属性,则为 null。
TypeInfo getSchemaTypeInfo()
与此属性相关联的类型信息。
boolean getSpecified()
如果在实例文档中显式给此属性一个值,则为True;否则为 false。
String getValue()
检索时,该属性值以字符串形式返回。
boolean isId()
返回是否此属性属于类型 ID(即包含其所有者元素的标识符)。
void setValue(Stringvalue)
检索时,该属性值以字符串形式返回。
DocumentType对象
NamedNodeMap getEntities()
包含在 DTD 中声明的内部和外部常规实体的 NamedNodeMap。
String getInternalSubset()
以字符串表示的内部子集,如果没有内部子集,则为 null。
String getName()
DTD 的名称;即紧跟在 DOCTYPE 关键字后面的名称。
NamedNodeMap getNotations()
包含在 DTD 中声明的表示法的NamedNodeMap。
String getPublicId()
外部子集的公共标识符。
String getSystemId()
外部子集的系统标识符。
Element对象
String getAttribute(String name)
Attr getAttributeNode(Stringname)
Attr getAttributeNodeNS(StringnamespaceURI,String localName)
String getAttributeNS(StringnamespaceURI,String localName)
NodeList getElementsByTagName(Stringname)
以文档顺序返回具有给定标记名称的所有后代Elements 的 NodeList。
NodeList getElementsByTagNameNS(StringnamespaceURI,String localName)
以文档顺序返回具有给定本地名称和名称空间URI 的所有后代 Elements 的 NodeList。
TypeInfo getSchemaTypeInfo()
与此元素相关的类型信息。
String getTagName()
元素的名称。
boolean hasAttribute(Stringname)
当具有给定名称的属性在此元素上被指定一个值或具有默认值时,返回 true;否则返回 false。
boolean hasAttributeNS(StringnamespaceURI,String localName)
当具有给定本地名称和名称空间 URI 的属性在此元素上被指定一个值或具有默认值时,返回 true;否则返回 false。
void removeAttribute(Stringname)
Attr removeAttributeNode(AttroldAttr)
移除指定的属性节点。
void removeAttributeNS(StringnamespaceURI,String localName)
void setAttribute(Stringname,String value)
Attr setAttributeNode(AttrnewAttr)
Attr setAttributeNodeNS(AttrnewAttr)
void setAttributeNS(StringnamespaceURI,String qualifiedName,String value)
void setIdAttribute(Stringname,boolean isId)
如果参数 isId 为 true,则此方法将指定的属性声明为用于确定用户的 ID 属性。
void setIdAttributeNode(AttridAttr,boolean isId)
如果参数 isId 为 true,则此方法将指定的属性声明为用户确定的 ID 属性。
void setIdAttributeNS(StringnamespaceURI,String localName,boolean isId)
如果参数 isId 为 true,则此方法将指定的属性声明为用户确定的 ID 属性。
NamedNodeMap对象
int getLength()
此映射中的节点数。
Node getNamedItem(Stringname)
检索通过名称指定的节点。
Node getNamedItemNS(StringnamespaceURI,String localName)
Node item(intindex)
返回映射中第 index 个项。
Node removeNamedItem(Stringname)
移除通过名称指定的节点。
Node removeNamedItemNS(StringnamespaceURI,String localName)
Node setNamedItem(Nodearg)
Node setNamedItemNS(Nodearg)
使用其 namespaceURI 和 localName 添加节点。
NodeList对象
int getLength()
列表中的节点数。
Node item(intindex)
返回集合中的第 index 个项。