定义:XML是一种数据传输和存储格式,用标签保存数据内容,利用标签嵌套关系保存数据之间关系
应用场景:不同平台间数据传输、程序配置文件
存在形式:XML文件、也存在内存或网络中,不要把XML狭隘理解为XML文件
校验:浏览器内置Html和XML解析器,可以校验xml是否正确
一、XML语法
- 1、声明或处理指令PI(processing instruction),指定解析器如何解析显示XML文档
- ①声明前不能有任何内容(如注释)
- <?xml version="1.0" encoding="utf-8" standalone="yes"?>
- version必须存在,当前xml所遵循规范版本1.0
- encoding指定xml解析编码,必须和xml文件保存编码一致,默认值iso8859-1(欧美拉丁字母符号,没有中文)
- standalone指明xml是否独立,默认值yes表明不依赖其他文档,no表明依赖其他文档(很多解析器都会忽略此属性)
-
- ②处理指令PI
- <?xml-stylesheet type="text/css" href="xxx.css"?>为XML指定样式css显示
-
- 2、元素(xml标签)
- 只能包含一个根标签
- 一个元素分为开始和结束标签<a>xxx</a>,其间有文本内容(标签体)
- 一个元素不含任何内容为自闭标签<a/>
- 区分大小写如<A>和<a>是不同标记
- 命名不能以数字、标点符号、"_"、"xml"开头,不能包含空格、冒号
-
- 3、一个元素可以有多个属性,属性值用单引号或双引号<a size="xxx" color="xxx"/>,属性名遵循元素命名规则
-
- 4、<!-- 注释内容 -->,除了声明前外可在任意位置、不能嵌套注释
-
- 5、转义字符/CDATA,可以使解析器将转义内容当作普通文本来处理
- ①转义字符
- &: &
- <: < >: >
- ": "
- ': '
- ②<![CDATA[内容]]>
- 被括起来的内容,会被浏览器当作普通文本来处理
-
- 区别:
- CDATA可以成段的进行转义,而转义字符一次只能转义一个字符
- CDATA可以保存原始数据,只通知解析器按普通文本去处理
- 转义字符改变了原始数据,用其他字符替代
二、XML约束
1、DTD是XML约束文件(.dtd),约束xml写法,并对xml校验
- ①外部引入,在外部文件中写DTD,必须用utf-8编码保存
- <!DOCTYPE 根元素名称 SYSTEM 文件位置>
- SYSTEM表明dtd在当前文件系统中,后面文件位置是当前硬盘中的位置
- <!DOCTYPE 根元素名称 PUBLIC "DTD名称" "DTD文件URL">
- PUBLIC表明dtd在网络公共位置中,后面指明dtd名字和所在网络URL地址
-
- ②内部引入,在xml中直接写<!DOCTYPE 根元素名称 [dtd约束的内容]>
-
- ③约束元素 <!ELEMENT 元素名称 元素约束>
- 元素约束:
- ANY表示包含任意子元素
- EMPTY表示不含子元素
- ()表示子元素,表示子元素必须按顺序并列出现
- |表示子元素出现其中之一
- #PCDATA表示包含标签体
- +表示一次或多次
- *表示0次或多次
- ?表示0次或一次
- 组合:<!ELEMENT 元素名称 ((TITLE*,AUTHOR?,EMAIL)* | COMMENT)>
-
- ④约束属性 <!ATTLIST 元素名 属性名 属性类型 属性约束>
- 属性类型:
- CDATA表明普通字符串
- ENUMERATED表明取指定枚举列表值
- ID表明属性值在文档中唯一,只能以字母或下划线开头
- 属性约束:
- #required表明当前属性必须存在
- #IMPLIED表明当前属性可选
- #FIXED表明当前属性具有固定值
- '默认值'表明当前属性具有默认值
-
- ⑤实体ENTITY,对一段重复使用的内容引用、复用
- 引用实体,在xml中引用的实体
- 定义实体:<!ENTITY 实体名称 “实体内容” >
- 使用实体:&实体名称;
- 参数实体,在dtd中引用的实体
- 定义实体:<!ENTITY %实体名称 "实体内容">
- 使用实体:%实体名称;
-
- 实例:
- <?xml version = "1.0" encoding="utf-8" ?>
- <!DOCTYPE 联系人列表[ <!ELEMENT 联系人列表 ANY> <!ELEMENT 联系人 (姓名,EMAIL)> <!ELEMENT 姓名 (#PCDATA)> <!ELEMENT EMAIL (#PCDATA)> <!ATTLIST 联系人 编号 ID #required> ]>
- <联系人列表>
- <联系人 编号="a1">
- <姓名>张三</姓名>
- <EMAIL>zhang@it315.org</EMAIL>
- </联系人>
- <联系人 编号="a2">
- <姓名>李四</姓名>
- <EMAIL>li@it315.org</EMAIL>
- </联系人>
- </联系人列表>
2、Schema也是xml约束文件(.xsd),目的是为了克服DTD缺陷
- 1)Schema本身符合xml语法,方便解析
- 2)对名称空间支持有非常好
- 3)比DTD更多数据类型,并且自定义数据类型
- 4)语义约束更精确,强于DTD
- 5)比DTD复杂多,学习成本高
-
- Schema文档必须有一个根结点(称为Schema)
- 名称空间xmlns:全世界唯一标识某个资源(通常是公司域名),仅是名称,不是真实的资源地址
-
- 实例:
- XSD文件(book.xsd)
- <?xml version="1.0" encoding="UTF-8" ?>
- <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" targetNamespace="www.xxx.com" elementFormDefault="qualified">
- <xs:element name='书架' >
- <xs:complexType>
- <xs:sequence maxOccurs='unbounded' >
- <xs:element name='书' >
- <xs:complexType>
- <xs:sequence>
- <xs:element name='书名' type='xs:string' />
- <xs:element name='作者' type='xs:string' />
- <xs:element name='售价' type='xs:string' />
- </xs:sequence>
- </xs:complexType>
- </xs:element>
- </xs:sequence>
- </xs:complexType>
- </xs:element>
- </xs:schema>
-
- XML文件(.xml)
- xmlns:w3指定名称空间(http://www.w3.org/2001/XMLSchema-instance)别名为w3
- w3:schemaLocation指定名称空间(www.xxx.com)来源于book.xsd文件(可以是网络地址)
- xmlns:my指定名称空间(www.xxx.com)别名为my
- <my:书架 xmlns:w3="http://www.w3.org/2001/XMLSchema-instance" w3:schemaLocation="www.xxx.com book.xsd" xmlns:my="www.xxx.com">
- <my:书>
- <my:书名>JavaScript网页开发</my:书名>
- <my:作者>张孝祥</my:作者>
- <my:售价>28.00元</my:售价>
- </my:书>
- </my:书架>
-
- XML文件(.xml)
- xmlns="www.xxx.com"可以忽略my 没有前缀默认使用这个空间
- <书架 xmlns:w3="http://www.w3.org/2001/XMLSchema-instance" w3:schemaLocation="www.xxx.com book.xsd" xmlns="www.xxx.com">
- <书>
- <书名>JavaScript网页开发</书名>
- <作者>张孝祥</作者>
- <售价>28.00元</售价>
- </书>
- </书架>
GitHub博客:http://lioil.win/2017/01/11/Xml-DTD-Schema.html
Coding博客:http://c.lioil.win/2017/01/11/Xml-DTD-Schema.html