我正在编写一个带有网页的脚本,并检测使用像facebook这样的按钮的次数.由于这最好用DOM完成,我决定使用
PHP的DOMDocument.
@H_301_1@不过,我遇到的一个问题是像facebook这样的按钮:
<fb:like send="true" width="450" show_faces="true"></fb:like>@H_301_1@由于此元素在技术上具有“fb”的命名空间,因此DOMDocument会发出警告,指出未定义此命名空间前缀.然后它继续去除前缀,所以当我到达所述元素时,它的标签不再是fb:like,而是像. @H_301_1@有没有办法“预注册”命名空间?有什么建议?
我遇到了同样的问题,我提出了以下解决方案/解决方法:
@H_301_1@没有干净的方法使用DOMDocument解析HTML与命名空间而不会丢失命名空间,但有一些解决方法:
@H_301_1@>使用另一个接受HMTL代码中的命名空间的解析器.在这里查看HTML解析器的详细列表.这可能是最有效的方法.
>如果你想坚持使用DOMDocument,你基本上必须对代码进行预处理和后处理. @H_301_1@>在将代码发送到DOMDocument-> loadHTML之前,请使用正则表达式,循环或任何您想要查找所有命名空间标记的内容,并将自定义属性添加到包含命名空间的开始标记.
>如果你想坚持使用DOMDocument,你基本上必须对代码进行预处理和后处理. @H_301_1@>在将代码发送到DOMDocument-> loadHTML之前,请使用正则表达式,循环或任何您想要查找所有命名空间标记的内容,并将自定义属性添加到包含命名空间的开始标记.
<fb:like send="true" width="450" show_faces="true"></fb:like>@H_301_1@然后会导致
<fb:like xmlNamespace="fb" send="true" width="450" show_faces="true"></fb:like>@H_301_1@>现在将编辑后的代码提供给DOMDocument-> loadHTML.它将删除命名空间,但它会保留导致的属性
<like xmlNamespace="fb" send="true" width="450" show_faces="true"></like>@H_301_1@>现在(再次使用正则表达式,循环或任何您想要的)查找具有属性xmlNamespace的所有标记,并将该属性替换为实际的名称空间.不要忘记将命名空间添加到结束标记! @H_301_1@我不认为OP仍在寻找答案,我只是在发表这篇文章的任何人发表这篇文章.