概念:
XML 指可扩展标记语言
XML 的设计宗旨是传输数据,而非显示数据 。存储和传输复杂的关系模型数据
XML 标签没有被预定义
使用约束的XML文档设计具有自我描述性。
XML 是 W3C 的推荐标准
XML语法:
文档声明 <?xml version="1.0" ecoding="utf-8">
元素:有开始有结束
注释
CDATA区 、特殊字符
处理指令(processing instruction)
- CDATA区:不被解析
<![CDATA[]]>或者转义字符:< script >子元素< /script >
- 处理指令
简称PI (processing instruction)。处理指令用来指挥解析引擎如何解析XML文档内容。例如,在XML文档中可以使用xml-stylesheet指令,通知XML解析引擎,应用css文件显示xml文档内容。 <?xml-stylesheet type="text/css" href="1.css"?>处理指令必须以“<?”作为开头,以“?>”作为结尾,XML声明语句就是最常见的一种处理指令。
XML约束概述
在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束
为什么使用DTD?
通过DTD,您的每一个XML文件均可携带一个有关其自身格式的描述。通过DTD,独立的团体可一致地使用某个标准的DTD来交换数据。而您的应用程序也可使用某个标准的DTD来验证从外部接收到的数据。您还可以使用DTD来验证您自身的数据。
常见的约束技术:
XML DTD
XML Schema
- XML DTD:文档类型定义,不严格,简单
l使用内部
DTD
l使用外部DTDSYSTEM
l使用公共DTDPUBLIC
<?
xmlversion="1.0"encoding="UTF-8"
?>
<!DOCTYPEbooksSYSTEM"books.dtd">
<books>
book>
bookname>红楼梦</bookname>
author>小张author>
book>
book>
bookname>西游记
bookname>
author>小明
author>
</
books
>
books.dtd(顺序,内容都严格要求)
导入本地的:
<!--使用外部的
dtd
-->
<!--使用内部的
dtd
-->
DOCTYPEbooks[
<!ELEMENTbooks(book+)>
book(bookname,author)>
bookname(#PCDATA)>
author(#PCDATA)>
]
>
导入外部的
- XML Schema:语法难,约束性强
xml解析(非常重要)
读写xml
XML解析开发包
Jaxp(sun)、Jdom、dom4j
dom(Document Object Medal)即文档对象模型
)
sax: (Simple API for XML)不是官方标准,但它是 XML 社区事实上的标准,几乎所有的 XML 解析器都支持它。
选择 DOM 还是 SAX
应用程序的目的:
如果必须对数据进行更改,并且作为 XML 将它输出,则在大多数情况下,使用 DOM
将如何使用数据:如果实际上只使用一小部分数据,则使用 SAX 将数据抽取到应用程序中,这种方法更好些
需
要速度:通常,SAX 实现比 DOM 实现快
JAXP(Java API for XML Processing )
JAXP是 Sun 提供的一套XML解析API,很好的支持DOM和SAX解析方式
JAXP 开发包是J2SE的一部分,它由javax.xml、org.w3c.dom 、org.xml.sax 包及其子包组成
在 javax.xml.parsers 包中,定义了几个工厂类,程序员调用这些工厂类,可以得到对xml文档进行解析的 DOM 或 SAX 的解析器对象
1、使用DOM方式解析XML
解析器工厂类DocumentBuilderFactory
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
解析器类DocumentBuilder
DocumentBuilder db = dbf.newDocumentBuilder();
解析生成Document对象
Document doc = db.parse("message.xml");
通过Document对象查询节点
document.getElementById 返回Node对象 --- 必须文档元素有ID属性
document.getElementsByTagName 返回NodeList对象
简单的元素增删改查例子:
<?xml version="1.0" encoding"UTF-8" standalone"no"?><!-- 使用内容的dtd --><books><bookkuan""><bookname>红楼梦</bookname><author>小张</author><value>15.6</value></book>爱我是撒地方</book></books>
publicclass test1 {/** * @param args * @throws ParserConfigurationException * @throws IOException * @throws SAXException * @throws TransformerException */staticvoid main(String[] args)throwsParserConfigurationException,SAXExceptionIOExceptionTransformerException// addElement();// updateText(); deleteElement();}/**删除元素 * @throws TransformerFactoryConfigurationError * @throws TransformerConfigurationException private()TransformerConfigurationExceptionTransformerFactoryConfigurationError{Document document = getDocument("dtd/books.xml");NodeList nodeListdocument.getElementsByTagName"author");Element element=(Element)item(0);//通过父亲来删除子节点getParentNode().removeChild(element); domToFile/**添加元素 * @throws TransformerFactoryConfigurationError * @throws TransformerConfigurationException * @throws TransformerException addElement documentcreateElement"value"setTextContent"15.6""book").appendChild//修改 updateText1"小红"/**因为是加载到内存,所以需要回写到xml文件中 * @param document(DocumentthrowsTransformerFactoryConfigurationError{TransformerFactory factory=TransformerFactorynewInstance();Transformer tffactorynewTransformer();transform(newDOMSource),newStreamResult));/**得到document * @param file * @returnstaticDocument(String file// TODO Auto-generated method stub// 解析器工厂DocumentBuilderFactory builderFactory =DocumentBuilderFactory// 解析器DocumentBuilder db builderFactorynewDocumentBuilder();Document=(Document dbparsefile);return;}
2、使用SAX方式解析XML
3.使用dom4j解析xml
Dom4j是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM的人分离出来而后独立开发的。与JDOM不同的是,dom4j使用接口和抽象基类,虽然Dom4j的API相对要复杂一些,但它提供了比JDOM更好的灵活性
Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j,例如Hibernate,包括sun公司自己的JAXM也用了Dom4j
使用Dom4j开发,需下载dom4j相应的jar文件
Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j,例如Hibernate,包括sun公司自己的JAXM也用了Dom4j
使用Dom4j开发,需下载dom4j相应的jar文件
注意:
1.一个XML元素可以包含字母、数字以及其它一些可见字符,但必须遵守下面的一些规范:
2.Xml文件中的注释采用:“<!--注释-->” 格式。
XML声明之前不能有注释
注释不能嵌套
XML 标签对大小写敏感
XML 必须正确地嵌套顺序
XML 文档必须有根元素
XML 的属性值须加引号
特殊字符必须转义
XML 中的空格会被保留