XML主要用来描述数据的结构,和数据的显示是分开的。在XML中,开始标签和结束标签必须配对。
空元素标签必须关闭,所谓空元素是指<Content>abc</Comtent>abc就是元素,所谓空元素就是<Content></Content>就是两个标签之间没有元素,使用的时候用<Content .... />这样关闭,就不使用<Content ...> </Content>这种形式了。
XML中,所有的标签都区分大小写,所有的标签都必须合理嵌套,所有标签的属性值都必须用双引号("")或者单引号('')括起来。在XML中,即使是数字字符,也必须加单引号或者双引号。在单引号中可以嵌套使用双引号,在双引号中可以嵌套使用单引号。
在XML中,有且只能有一个根元素。
每个XML文档都有一个逻辑和一个物理结构。
XML文档的逻辑组成:
XML声明:<? xml 版本信息 [编码信息] [文档独立性信息] ?>
版本声明 <? xml version="1.1" ?>
编码声明<? xml version="1.1" encoding="gb2312" ?>
独立文档声明,是否依赖于外部文档。<? xml version="1.1" standalone="no/yes" ?>
文档类型声明
DTD:文档类型定义。DTD文件也是一个文本文件,用.dtd作为后缀名。通过文档类型声明,指出xml文档所用的DTD。文档类型声明有两种形式,一种声明在一个外部文件中,如下: <! DOCTYPE greeting SYSTEM "hello.dtd">,SYSTEM指明这是一个私有的DTD文件;一种是直接在xml文档中给出DTD,如下:<? xml version="1.1" standalone="yes" ?>
<!DOCTYPE greeting [<!ELEMT greeting (#PCDATA)> ]>
【greeting好像是根元素的标签】
元素
在xml中,元素由开始标签、元素内容和结束标签构成,对于空元素,由空元素标签构成。
每个元素由一个用名字标识的类型,同时它可以有一个属性说明集,每个属性说明集有一个名字和一个值。
元素的四种形式:
空元素:<student/>
带有属性的空元素:<student name="marcel" age="18"/>
带有内容的元素:
<stutent>
这是一个学生的信息
<name>marcel</name>
<age>18</age>
</student>
<student name="marcel">
<age>18</age>
</student>
元素和标签的区别:
元素是开始标签,结束标签以及两者之间的一切内容,包括属性,文档,注释以及子元素。标签是指一对尖括号<>和两者之间的内容,也包括元素名和所有属性。
例如:<font color="blue">是一个标签,</font>也是一个标签。而<font color="blue">hello</font>则是一个元素。
元素的内容可以包含子元素、字符数据、字符引用和实体引用、CDATA段。
在字符数据中,不能有和号&和小于号<,因为未经处理的小于号和和号在xml中往往被解释为标记的起始定界符。
在xml中,提供了5个预定义实体引号,小于号<、大于号>、双引号"、单引号'、和号&。这5个特殊字符可以通过字符引用的方式去引用。
字符引用和预定义实体引用都是以一个和号&开始并以一个分号;结束。如果是字符引用,需要再和号之后加上一个井号#,之后是所需字符的十进制代码或者十六进制代码。如果是预定义实体引用,在和号之后协商字符的助记符。
引用小于号< 引用大于号 > 引用双引号" 引用单引号' 引用和号&。
CDATA段中包含的都是纯字符数据,在字符数据可以出现的任何地方都可以使用CDATA段。CDATA段主要用于需要将整个文本解释为字符数据而不是标记的情况下。CDATA段中的内容不被XML处理器分析,所以可以在其中包含任意的字符。
CDATA段以字符串<![CDATA["开始,以字符串"]]>结束。
注释 <!-- -->
处理指令:允许文档中包含由应用程序来处理的指令,在xml文档中可能会包含一些非xml格式的数据,这些数据xml处理器无法处理,我们就可以通过处理指令来通知其他应用程序来处理这些数据。 处理指令 <? ?>
原文链接:https://www.f2er.com/xml/300357.html