上篇随笔谈到了XML的一些文档的规范,这篇我们来继续学习与认识XML。
一、特殊字符与CDATA区域
在XML文档中如果文本字符中包含了一些特殊的字符,例如<或者&等等,这些字符会引起XML文档会引起文档的混乱。
解决方法如下:
1.使用实体引用:使用另一个特殊符号代替这些特殊符号
2. 使用CDATA标记:将整个文档定义成字符串。
在特殊标记CDATA下,所有的特殊字符甚至是有效的元素都将被当成简单的字符串进行处理。实体引用也会失去作用,变成直接文本。
CDATA的语法格式如下:
<![CDATA[文本内容]]>
例如:
<![CDATA][1+3<6]>
在XML文档中的注释方法与HTML中完全一致
XML注释语法格式如下:
<!--注释字符串-->
XML注释中允许包含元素和标签,注释不能放在声明之前,不能在注释中使用双中划线,不能再标签体内使用注释,注释内容不能使用“-->”结尾。
二、XML处理指令
简称PI(processing Instruction)。处理指令用来指挥解析引擎如何解析XML文档内容。
XML处理指令用于给处理XML文档的应用程序提供信息,告诉处理程序应该如何解析XML文档,一个完整的XML文档的处理程序,可以读取XML文档的处理指令。
XML处理指令格式如下:
<?处理指令名 处理指令信息?>
例如:<?xml-stylesheet=”text/css” href=”(css样式文件)”?>
三、XML属性
XML属性的特征:
2.同一个XML元素不能有多个同名的属性。
3.XML元素里的多个属性之间没有先后顺序。
总结:
1. 必须有一个根元素且只有一个
2. 元素必须合理结束
3. 元素之间必须合理嵌套
只要不满足以上条件的XML文档,那就说明它就不是一个格式良好的XML文档
只要满足就是一个格式良好的XML文档
并且遵守了DTD或者schema就是一个有效的XML文档。
XML文档是一种标准结构化文档,因此可以转换成DOM(Document Object Model)文档模型树,其根节点对应DOM树的根节点。