XML学习(一)
一、XML概念:
1.EXtensible Markup Language指的是可扩展标记语言,
2.用来传输和存储数据.XML是独立于软件和硬件的信息传输工具
3.XML标签没有被预定义,需要自行定义标签。HTML是预定义的。
4.XML具有自我描述性。
5.XML是不作为的
例子:
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
body>Don'tforget the meeting!</body>
note>
这个便签有自我描述性。拥有标题及留言,同时包含了发送者和接收着的信息。但是,这个XML没有做任何事情,仅仅是包装在XML标签中的纯粹的信息。
6.XML仅仅是纯文本。有能力处理纯文本的软件都可以处理XML。
7.XML是W3C的推荐标准
二、XML和HTML的区别:
1. XML是用来传输和存储数据,焦点是数据的内容,HTML是用来显示数据,焦点是数据的外观。XML不是对HTML的替代,是HTML的补充。
三、XML的用途:常用于简化数据的存储和共享
1.把数据从HTML中分离,数据存储在独立的xml文件中。读取XML文件,更新HTML中的数据内容。HTML只布局和显示
2.简化数据共享。XML数据以纯文本的格式进行存储,因此提供了一种独立于软件和硬件的数据存储方法(计算机系统和数据使用不兼容的格式来存储数据),不同应用程序共享数据变的容易。
3.简化数据传输。可以通过各种不兼容的应用程序来读取数据,以XML交换数据降低了这种复杂性。
4.简化平台的变更。在不损失数据的情况下,更容易扩展或升级到新的操作系统,新的应用程序或新的浏览器(文本格式存储)
5.使数据更有用。因为XML独立于硬件、软件及应用程序,不通的应用程序都能访问该数据。
6.用于创建新的Internet语言.很多新的语言都是通过XML创建的。如:XHTML,WSDL,WAP,WML,RSS,RDF,OWL,SMIL等
四。XML树结构
XML文档是一种树形结构,从“根部”开始,扩展到“枝叶”
<!-- XML 声明。它定义 XML 的版本 (1.0) 和所使用的编码 (ISO-8859-1 = Latin-1/西欧字符集)--> <?xml version="1.0" encoding="ISO-8859-1"?> <!--描述文档的根元素--> <note> <!--描述根的 4 个子元素--> <to>George</to> <from>John</from> <heading>Reminder</heading> <body>Don't forget the meeting!</body> <!--定义根元素的结尾--> </note> |
1.XML文档必须包含根元素,该元素是其他元素的父元素
2.XML树,从根部开始,扩展到树的最低端。
3.所有元素均可拥有子元素. 父、子以及同胞等术语用于描述元素之间的关系。父元素拥有子元素。相同层级上的子元素成为同胞(兄弟或姐妹)。所有元素均可拥有文本内容和属性(类似 HTML 中)
五、XML语法
1.所有的XML元素都必须有关闭标签(结束标签)。声明不属于XML本身的组成部分。它不是 XML 元素,也不需要关闭标签。
2. XML标签对大小写敏感
3.XML必须正确的嵌套
4.XML文档必须有根元素
5.XML的属性值必须加引号 <notedate="08/08/2008"></note>
6.实体引用:在 XML 中,只有字符"<" 和 "&" 确实是非法的。大于号是合法的,但是用实体引用来代替它是一个好习惯
< |
< |
小于 |
> |
> |
大于 |
& |
& |
和号 |
' |
' |
单引号 |
" |
" |
引号 |
7.注释 <!--注释内容-->
8.XML中,文档中的空格不会被删减。HTML会把多个连续的空格字符裁剪(合并)为一个
9.XML以LF存储换行。在Windows 应用程序中,换行通常以一对字符来存储:回车符 (CR) 和换行符 (LF)。这对字符与打字机设置新行的动作有相似之处。在 Unix 应用程序中,新行以 LF 字符存储。而 Macintosh 应用程序使用 CR 来存储新行。
六。XML元素:从开始标签到结束标签的部分。元素可包含其他元素,文本或两者的混合物。元素可以有属性。
1.命名规则:可以使用任何名称,没有保留字词
1)名称可以含字母、数字及其他字符
3)名称不能以“XML”开始
4)名称不能有空格
5)尽量不要用- . :
2.XML元素是可扩展的,可以经常在不中断应用程序的情况下进行扩展