下载地址:https://github.com/samacs/simple_html_dom
解析器不仅仅只是帮助我们验证html文档;更能解析不符合W3C标准的html文档。它使用了类似jQuery的元素选择器,通过元素的id,class,tag等等来查找定位;同时还提供添加、删除、修改文档树的功能。当然,这样一款强大的html Dom解析器也不是尽善尽美;在使用的过程中需要十分小心内存消耗的情况。不过,不要担心;本文中,笔者在最后会为各位介绍如何避免消耗过多的内存。
开始使用
上传类文件以后,有三种方式调用这个类:
<FONT style="COLOR: #ff0000">从url中加载html文档从字符串中加载html文档
从文件中加载html文档
<div class="codetitle"><a style="CURSOR: pointer" data="32098" class="copybut" id="copybut32098" onclick="doCopy('code32098')"> 代码如下: