DTD Document Type Definition 文档类型定义:为数据编写相应的模式,从而确保数据的有效性。
DTD 是一个面向SGML语言的规范,DTD不仅能规范XML,还能规范SGML以及HTML。
DTD描绘了一个标记语言的词汇表和语法,定义了文档的整体结构以及语法结构。DTD是一种保证XML文档格式是否正确的有效方法。语法形式简单,容易学习。
缺陷:不是专门面向XML的数据模式语言,没有采用XML的语法形式,并不能满足XML的自动化处理的要求(不支持命名空间,缺乏对文档结构、属性、数据类型等约束的足够描述能力等)。
DTD规则可以直接出现在XML文档中,也可以作为一个单独的DTD文件关联与目标XML文档。
在XML文档中,直接在根节点之前声明dtd规则:
<!DOCTYPE root_element [ ...... ]>引用私有的外部dtd:
<!DOCTYPE root_element SYSTEM "DTD_location">根节点名称 System表示私有 DTD_location 为相对或绝对的url。
引用共有的外部dtd:
<!DOCTYPE root_element PUBLIC "DTD_name" "DTD_location">根节点 public表示共有 先根据dtd的name去寻找,找不到再用location去查找。
元素:ELEMENT
<!ELEMENT element-name ...>后面可以跟元素,属性和文本。
使用EMPTY表示空,ANY表示任意内容
只包含文本内容:
<!ELEMENT element-name (#PCDATA)>PCDATA 为Parsed Character Data ,XML解析器进行解析的字符数据,不包含任何XML标记。
包含子元素:
<!ELEMENT element-name (child1,child2,...)>(,)表示序列,顺序是固定的。对元素的规定可以加一些正则表达式中的符号 | * ? + 等。
包含子元素与文本内容:
<!ELEMENT element-name (#PCDATA | child1 | child2 | ...)*>PCDATA必须放在最前面。
<!ATTLIST element-name attr-name attr-type attdesc>ATTLIST中的常见属性类型:
CDATA 字符数据“Character data”,不包括转义内容的纯文本内容。文本中的标签不会被当作标记,实体也将不会得到扩展。
(value1|value2|..) 枚举值
ID 表示属性的值在文档中是唯一的,即KEY
IDREF 属性的值引用另一个属性的ID,即FRIEND-KEY
ENTITY 表示属性是一个实体
ENTITIES 用空格隔开的多个实体。
NMTOKEN 表示属性的值必须是有效的 XML 名称标记(Name Token)。
value 缺省值
#required 必须的
#IMPLIED 可选的
#FIXED value 属性值为固定的value
举例:
<!ATTLIST memo id ID #required securit (high|low) "high" keywords NMTOKENS #IMPLIED >
实体:ENTITY 是内容的占位符,只需要一次声明就可以多次使用。
内部参数实体:
<!ENTITY % entity-name “entity_value”>实体名与%之间有空格,但使用时没有,引用时%entity-name; 以;结束。
外部参数实体与引用dtd相似,有引用私有的实体和公有的实体两种:
<!ENTITY % entity-name SYSTEM "URI"> <!ENTITY % entity-name PUBLIC "public_ID" "URI">一般实体,如之前的预定义的实体一样在xml中使用,
<?xml version="1.0" standalone="yes" ?> <!DOCTYPE author [ <!ELEMENT author (#PCDATA)> <!ENTITY us "You and me"> ]> <author>&us;</author>
dtd实例:
为1.xml中两个xml文档所对应的dtd
<?xml version="1.0" encoding="UTF-8"?> <!-- 被2012 () 使用XMLSpy v编辑的 (http://www.altova.com) by --> <!ELEMENT info (aliasTable,missionTable,spyTable)> <!ENTITY % p "(#PCDATA)"> <!ENTITY % q "CDATA"> <!ELEMENT aliasTable (arow*)> <!ELEMENT arow (spyREF,alias)> <!ATTLIST arow aID %q; #required > <!ELEMENT spyREF %p;> <!ELEMENT alias %p;> <!ELEMENT missionTable (mrow*)> <!ELEMENT mrow (spyREF,date,description,status)> <!ATTLIST mrow mID ID #required > <!ELEMENT date %p;> <!ELEMENT description %p;> <!ELEMENT status %p;> <!ELEMENT spyTable (srow*)> <!ATTLIST srow spyID ID #required > <!ELEMENT srow (firstName,lastName)> <!ELEMENT firstName %p;> <!ELEMENT lastName %p;>
<?xml version="1.0" encoding="UTF-8"?> <!ELEMENT info (row*)> <!ENTITY % p "(#PCDATA)"> <!ATTLIST row spyID ID #required > <!ELEMENT row (firstName,lastName,alias*,mission*)> <!ELEMENT firstName %p;> <!ELEMENT lastName %p;> <!ELEMENT alias %p;> <!ELEMENT mission (date,status)> <!ELEMENT date %p;> <!ELEMENT description %p;> <!ELEMENT status %p;>