XMLDOM、XMLHttpRequest 是 JavaScript 中比较核心比较重要的一些点,现在有很多成熟的库帮我们封装了这些功能,包括兼容性方便也做了处理,很方便我们使用,但是这些底层核心,我觉得还是很有必要学习了解一下。
背景知识
在介绍这些知识点之前,很有必要先来了解一下 DOM(Document Object Model) 的历史发展过程,以及它的 level 。
DOM 可被 JavaScript 用来读取、改变 HTML、XHTML 以及 XML 文档。
DOM 被分为不同的部分(核心、XML及HTML)和级别(DOM Level 1/2/3/4)
Netscape Navigator 4和IE4分别发布于1997年的6月和10月发布的DHTML,他们是未形成标准的试验性质的初级阶段的DOM,称为DOM0,并不是标准。
在 1998 年,W3C 发布了第一级的 DOM 规范(DOM1)。这个规范允许访问和操作 HTML 页面中的每一个单独的元素。
DOM2 在 2000年发布
DOM3 在 2004年发布
DOM4 在 2015 年发布
(以上这些内容可以在 w3c 的官网查到,https://www.w3.org/TR/?tag=dom ,现在能查到的最早的记录是 2000年的 DOM2)
与此同时,也能看到现在最新的 DOM 级别是 DOM4。(于 2015-11-19 发布)
最新的版本是 DOM4.1 。
OK,那么,现在需要知道的是:1、DOM标准肯定是按照更标准,更好,更完美的方向前进的。2、不同的浏览器实现的标准不一样(有的是按照DOM3的标准来实现的,有的是按照DOM2的标准来实现的,按照DOM1标准来实现的也有,最新的浏览器应该也有按照DOM4的标准来做的吧)。3、DOM3的标准持续时间最长,虽然现在 DOM4 发布了,但是现在主流的标准还是 DOM3,所以现在大部分浏览器都是实现了 DOM3 的标准。
正因为不同的浏览器实现的标准不一样,所以我们要做兼容,这也是我们要做兼容的根本原因所在。
OK,有了这个背景知识,开始我们下面的内容
XML、XMLDOM
在之前的IE6、7、8,微软为了开发人员方便的处理 XML,创建了 MSXML 库。
var xmlDom = new ActiveXObject('MSXML2.DOMDocument');
下面有一份 ActiveXObject 类型表:
XML版本字符串 | 说明 |
---|---|
Microsoft.XmlDom | 最初随同IE发布,不建议使用 |
MSXML2.DOMDocument | 脚本处理而更新的版本,仅在特殊情况作为备份用 |
MSXML2.DOMDocument.3.0 | 在JavaScript中使用,这是最低的建议版本 |
MSXML2.DOMDocument.4.0 | 脚本处理时并不可靠,使用这个版本导致安全警告 |
MSXML2.DOMDocument.5.0 | 脚本处理时并不可靠,使用这个版本导致安全警告 |
MSXML2.DOMDocument.6.0 | 脚本能够可靠处理的最新版本 |
ps:在这六个版本中微软只推荐三种:
1、MSXML2.DOMDocument.6.0 【最可靠最新的版本】
2、MSXML2.DOMDocument.3.0 【兼容性较好的版本】
3、MSXML2.DOMDocument 【仅针对IE5.5之前的版本】
考虑到这三个版本在不同的 windows 平台和浏览器下会有不同的支持,那么为了实现兼容,我们应该考虑这样操作:从6.0 -> 3.0 -> 备用版本 这条路线进行实现。
(其实,我们在做其他兼容的时候也是,从高往低来实现兼容)
function createXMLDOM() {
var version = [
'MSXML2.DOMDocument.6.0','MSXML2.DOMDocument.3.0','MSXML2.DOMDocument'
];
for(var i=0; i<version.length; i++) {
try{
var xmlDom = new ActiveXObject(version[i]);
return xmlDom;
} catch(e) {
// 跳过
}
}
throw new Error('您的系统或浏览器不支持MSXML!'); // 循环后抛出错误
}
OK,我们现在通过这个方法就可以拿到一个 xmlDom 对象了。
var xmlDom = createXMLDOM();
// 载入 XML 文件
// 1、加载XML字符串loadXML()
xmlDom.loadXML('<root version="1.0"><user>Yu</user></root>');
alert(xmlDom.xml);
// 2、加载XML外部文件load()
xmlDom.load('text.xml');
console.log(xmlDom.xml)
XML 和 XHTML 一样,都是通过 DOM 节点操作的。
var user = xmlDom.getElementsByTagName('user')[0]
console.log(user.nodeType)
console.log(user.tagName)
console.log(user.firstChild.nodeValue)
DOM 不单单可以获取 XML 节点,也可以创建:
var email = xmlDom.createElement(email)
xmlDom.documentElement.appendChild(email)
// 为创建的节点添加内容
var emailText = xmlDom.createTextNode('react.dong.yu@gmail.com')
email.appendChild(emailText)
同步及异步
load() 方法是用于从服务器端载入 XML 的,并且限制在同一台服务器上的 XML 文件。那么在载入的时候有两种模式:同步和异步。
- 同步:就是在加载 XML 完成之前,代码不会继续执行,直到完全加载了 XML 再返回。好处就是简单、方便,坏处就是如果加载的数据停止响应或延迟太久,浏览器会一直堵塞从而造成假死状态。
xmlDom.async = false //设置同步,false
xmlDom.async = true //设置异步,默认
通过异步加载,我们发现获取不到 XML 信息。原因是,它并没有完全加载 XML 就返回了,也就是说,在浏览器内部加载一点,返回一点,加载一点,返回一点。这个时候,我们需要判断是否完全加载,并且可以使用了,在进行获取输出。
XML DOM 中 readystatechange 事件
就绪状态 | 说明 |
---|---|
1 | DOM正在加载 |
2 | DOM已经加载完数据 |
3 | DOM已经可以使用,但某些部分还无法访问 |
4 | DOM已经完全可以使用 |
var xmlDom = createXMLDOM()
xmlDom.async = true
xmlDom.onreadystatechange = function() {
if(xmlDom.readyState === 4) {
alert(xmlDom.xml)
}
}
xmlDom.load('test.xml') // 放在后面重点体现异步的作用
1、可以通过 readyState 来了解事件的执行次数,将 load() 方法放到最后不会因为代码的顺序而导致没有加载。并且 load() 方法必须放在 onreadystatechange 之后,才能保证就绪状态变化时调用该事件处理程序,因为要先触发。
2、不能够使用this,不能够使用 IE 的事件处理函数,原因是 ActiveX 控件为了预防安全性问题
DOM2 中的 XML
IE可以实现了对XML字符串或XML文件的读取,其他浏览器也各自实现了对XML处理功能。DOM2级在 document.implementaion
中引入了 createDocument()
方法。其他浏览器都支持。
1、创建XMLDOM对象
var xmlDom = document.implementation.createDocument('','root',null); // 创建
var user = xmlDom.createElement('user'); // 创建user元素
xmlDom.getElementsByTagName('root')[0].appendChild(user); // 添加到root下
var value = xmlDom.createTextNode('Yu'); // 创建文本
xmlDom.getElementsByTagName('user')[0].appendChild(value); // 添加到user下
alert(xmlDom.getElementsByTagName('root')[0].tagName);
alert(xmlDom.getElementsByTagName('user')[0].tagName);
alert(xmlDom.getElementsByTagName('user')[0].firstChild.nodeValue);
1、DOM2中不支持 loadXML() 方法,所以,无法简易的直接创建 XML 字符串,所以,只能采用以上的做法。
2、createDocument() 方法需要传递三个参数,命名空间,根标签名和文档声明,由于 JavaScript 管理命名空间比较困难,所以留空即可。文档声明一般根本用不到,直接null即可。命名空间和文档声明留空,表示创建XMLDOM对象不需要命名空间和文档声明。
2、DOMParser 类型
由于 DOM2 没有 loadXML() 方法直接解析 XML 字符串,所以提供了 DOMParser 类型来创建 XML DOM 对象。IE9、Safari、Chrome 和 Opera 都支持这个类型。
var xmlParser = new DOMParser(); // 创建DOMParser对象
var xmlStr = '<root><user>Yu</user></root>'; // 创建DOMParser对象
var xmlDom = xmlParser.parseFromString(xmlStr,'text/xml'); // 创建XML DOM对象
alert(xmlDom.getElementsByTagName('user')[0].tagName)
XML DOM 对象是通过DOMParser对象中的parseFromString方法来创建的,两个参数:XML字符串和内容类型text/xml。
3、XML Serializer 类型
由于DOM2没有序列化XML的属性,所以提供了XMLSerializer类型来帮助序列化XML字符串。IE9、Safari、Chrome和Opera都支持这个类型。
var serializer = new XMLSerializer(); // 创建XMLSerializer对象
var xml = serializer.serializeToString(xmlDom); // 序列化XML
alert(xml);
4、解析错误
在 DOM2 级处理 XML 发生错误时,并没有提供特有的对象来捕获错误,而是直接生成另一个错误的XML文档,通过这个文档可以获取错误信息。
var errors = xmlDom.getElementsByTagName('parsererror');
if (errors.length > 0) {
throw new Error('XML格式有误:' + errors[0].textContent);
}
PS:errors[0].firstChild.nodeValue也可以使用errors[0].textContent来代替。
5、跨浏览器处理XML
如果要实现跨浏览器就要思考几个问题:
1、load()只有IE、Firefox、Opera支持,所以无法跨浏览器;
2、获取XMLDOM对象顺序问题,先判断先进的DOM3,然后再去判断落后的IE;
3、针对不同的IE和DOM2级要使用不同的序列化;
4、针对不同的报错进行不同的报错机制。
//首先,我们需要跨浏览器获取XML DOM
function getXMLDOM(xmlStr) {
var xmlDom = null;
if (typeof window.DOMParser != 'undefined') { // W3C
xmlDom = (new DOMParser()).parseFromString(xmlStr,'text/xml');
var errors = xmlDom.getElementsByTagName('parsererror');
if (errors.length > 0) {
throw new Error('XML解析错误:' + errors[0].firstChild.nodeValue);
}
} else if (typeof window.ActiveXObject != 'undefined') { // IE
var version = [
'MSXML2.DOMDocument.6.0','MSXML2.DOMDocument'
];
for (var i = 0; i < version.length; i ++) {
try {
xmlDom = new ActiveXObject(version[i]);
} catch (e) {
//跳过
}
}
xmlDom.loadXML(xmlStr);
if (xmlDom.parseError != 0) {
throw new Error('XML解析错误:' + xmlDom.parseError.reason);
}
} else {
throw new Error('您所使用的系统或浏览器不支持XML DOM!');
}
return xmlDom;
}
// 其次,我们还必须跨浏览器序列化XML
function serializeXML(xmlDom) {
var xml = '';
if (typeof XMLSerializer != 'undefined') {
xml = (new XMLSerializer()).serializeToString(xmlDom);
} else if (typeof xmlDom.xml != 'undefined') {
xml = xmlDom.xml;
} else {
throw new Error('无法解析XML!');
}
return xml;
}
由于兼容性序列化过程有一定的差异,可能返回的结果字符串可能会有一些不同。之于load()加载XML文件则因为只有部分浏览器支持而无法跨浏览器。
XPath
XPath 是一种节点查找手段,对比之前使用标准DOM去查找XML中的节点方式,大大降低了查找难度,方便开发者使用。但是,DOM3级以前的标准并没有就XPath做出规范;直到DOM3才首次推荐到标准规范行列。大部分浏览器实现了这个标准,IE则以自己的方式实现了XPath。
IE中的 XPath
selectSingleNode() // 获取单一节点
selectNode() // 获取节点集合
selectSingleNode() 方法接受一个 XPath 模式(也就是查找路径)找到匹配的第一个节点并将它返回,没有则返回null。
XPath 查找手段,就是路径查找,结构树查找
var node = xmlDom.selectSingleNode('root/user')
alert(node.xml)
alert(node.firstChild.nodeValue)
上下文节点: 我们通过 xmlDom 这个对象实例调用犯法,而xmlDom这个对象实例其实就是一个上下文节点,这个节点指针指向的是根,也就是root元素之前。那么如果我们把这个指针指向user元素之前,那么结果就会有所变化。
// 通过xmlDom,并且使用root/user的路径
var user = xmlDom.selectSingleNode('root/user')
alert(user.tagName) // user
// 通过xmlDom.documentElement,并且使用user路径,省去了root
var user = xmlDom.documentElement.selectSingleNode('user')
alert(user.tagName) // user
// 通过xmlDom,并且使用user路径,省去了root
var user = xmlDom.selectSingleNode('user')
alert(user.tagName) // 找不到,出错
xmlDom 和 xmlDom.documentElement 都是上下文节点,主要就是定位当前路径查找的指针,而 xmlDom 对象实例的指针就是在最根上。
// 双斜杠可以获取不关心层次的第一个user
var node = xmlDom.selectSingleNode('//user[1]')
alert(node.xml)
// 通过唯一的属性找到user节点
var node = xmlDom.selectSingleNode('root/user[@id=6]')
alert(node.xml)
W3C 下的 XPath
在 DOM3 级XPath规范定义的类型中,最重要的两个类型是 XPathEvaluator 和 XPathResult。其中,XPathEvaluator 用于在特定上下文对 XPath 表达式求值。
XPathEvaluator的方法
createExpression(e,n)将XPath表达式及命名空间转化成XPathExpression
createNSResolve(n) 根据 n 命名空间创建一个新的XPathNSResolver对象
evaluate(e,c,n,t,r)结合上下文来获取XPath表达式的值
W3C实现XPath查询节点比IE来的复杂,首先第一步就是需要得到XPathResult对象的实例。得到这个对象的实例有两种方法:
一种是通过创建XPathEvaluator对象执行evaluate()方法
另一种是直接通过上下文节点对象(比如xmlDom)来执行evaluate()方法。
//两种方式创建XPathResult
var eva = new XPathEvaluator();
var result = eva.evaluate("root/user",xmlDom,null,XPathResult.ORDERED_NONE_ITERATOR_TYPE,null);
alert(result);
//使用上下文节点对象(xmlDom)创建XPathResult
var result = xmlDom.evaluate("root/user",null);
alert(result);
相对而言,第二种简单方便一点,但evaluate方法有五个属性:1·XPaht路径、2·上下文节点对象、3·命名空间求解器(通常是null)、4·返回结果类型、5·保存结果的XPathResult对象(通常是null)。
对于第四个参数:返回结果类型,有10种不同的类型,主要掌握两个:
1·获取一个单一节点。(XPathResult.FIRST_ORDERED_NODE_TYPE)(返回只包含一个节点的节点集合,且这个节点是在文档中第一个匹配的节点)
2·获取一个节点集合。(XPathResult.ORDERED_NODE_ITERATOR_TYPE)(返回匹配节点的节点集合,顺序为节点在文档中出现的顺序。这是最常用到的结果类型)
下一节是 XMLHttpRequest