DTD(DocumentType Definition),全称为文档类型定义。
定义:在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。常见的约束技术有 1、XML DTD 2、XML Schema
编写方式: DTD约束即可以作为一个单独的文件编写,也可以在XML文件内编写。
引用DTD约束
XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:
A、当引用的文件在本地时:
<!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">
例如:<!DOCTYPE 书架 SYSTEM “book.dtd”>。
<!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">
例如:<!DOCTYPE web-app PUBLIC
"-//Sun Microsystems,Inc.//DTD Web Application 2.3//EN"
"http://java.sun.com/dtd/web-app_2_3.dtd">
DTD约束语法细节
1、 元素定义
在DTD文档中使用ELEMENT声明一个XML元素
语法:<!ELEMENT 元素名称元素类型>
注:元素类型可以是元素内容、或类型
eg:<!ELEMENT 书架(书名,作者,售价)> 元素内容用()括起来,先后顺序不变
eg:<!ELEMENT 书名(#PCDATA)> #PCDATA为可解析的字符,就是字符串
元素类型:直接书写,DTD规范定义了如下几种类型
EMPTY:用于定义空元素,例如<br/>
ANY:表示元素内容为任意类型。
元素内容:1、用逗号分隔,表示内容的出现顺序必须与声明时一致。
eg: <!ELEMENTMYFILE (TITLE,AUTHOR,EMAIL)> 先后顺序不变
2、用|分隔,表示任选其一,即多个只能出现一个
eg:<!ELEMENT MYFILE(TITLE|AUTHOR|EMAIL)> 任选其一
注:在元素内容中也可以使用+、*、?等符号表示元素出现的次数
+: 一次或多次 (书+)
?:0次或一次 (书?)
*: 0次或多次 (书*)
2、 属性定义
语法格式:<!ATTLIST 元素名
……
>
例如: <!ATTLIST 商品
类别 CDATA #required #required为必须定义的属性
颜色 CDATA #IMPLIED #IMPLIED为可选的属性可写可不写
>
对应XML文件:
<商品类别="服装" 颜色="黄色">…</商品> 写了颜色属性
<商品类别="服装">…</商品> 不写颜色属性也可
设置说明有以下几种:
#IMPLIED:可以设置也可以不设置
#FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。但需要为该属性提供这个值
直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。
eg: <!ATTLIST 页面作者
姓名 CDATA #IMPLIED 可选
年龄 CDATA #IMPLIED 可选
联系信息 CDATA #required 必须定义
网站职务 CDATA #FIXED "页面作者" 值固定为"页面作者"
个人爱好 CDATA "上网" 不定义个人爱好也默认为"上网"
>
ENUMERATED :属性的类型可以是一组取值的列表,在 XML 文件中设置的属性值只能是这个列表中的某个值(枚举)
ID:表示属性的设置值为一个唯一值。ID 属性的值只能由字母,下划线开始,不能出现空白字符
ENTITY(实体)
3、 实体定义
实体用于为一段内容创建一个别名,以后在XML文档中就可以用别名引用这段内容了。在DTD定义中,一条<!ENTITY …>语句用于定义一个实体。
实体类型:A、引用实体(XML文档用)
引用方式:&实体名称;
eg:<!ENTITY copyright “I am a programmer">
©right; 相当于拿到了I am a programmer(简单说就是简写)
B、参数实体(DTD自己用)
引用方式:%实体名称;
eg:<!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址">
<!ELEMENT个人信息 (%TAG_NAMES; | 生日)>
相当于:<!ELEMENT 个人信息 (姓名 | EMAIL | 电话 | 地址 | 生日)>
注:校验XML与DTD是否匹配,直接放到eclipse看有没有报错就OK了。
例子:(在xml文件内编写DTD)
<?xmlversion="1.0" encoding="UTF-8"standalone="yes"?>
<!DOCTYPE 书架 [
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
]>
<书架>
<书>
<书名>Java就业</书名>
<作者>刘志跃</作者>
<售价>50元</售价>
</书>
...
</书架>