本文实例讲述了PHP使用simple_html_dom解析HTML的方法。分享给大家供大家参考,具体如下:
今天写了两个爬虫,一个使用Python,一个使用PHP,说实在,两个实现的方式都很方便.
下面说一下使用simple_html_dom这个开源类来解析HTML代码:
1. 下载simple_html_dom:
或者点击此处。
2. 用法示例:
PHP;">
find('a') as $e)
echo $e->href . '
'; // find all image foreach($html->find('img') as $e) echo $e->src . '
'; // find all image with full tag foreach($html->find('img') as $e) echo $e->outertext . '
'; // find all div tags with id=gbar foreach($html->find('div#gbar') as $e) echo $e->innertext . '
'; // find all span tags with class=gb1 foreach($html->find('span.gb1') as $e) echo $e->outertext . '
'; // find all td tags with attribite align=center foreach($html->find('td[align=center]') as $e) echo $e->innertext . '
'; // extract text from table echo $html->find('td[align="center"]',1)->plaintext.'
'; // extract text from HTML echo $html->plaintext; ?>
'; // find all image foreach($html->find('img') as $e) echo $e->src . '
'; // find all image with full tag foreach($html->find('img') as $e) echo $e->outertext . '
'; // find all div tags with id=gbar foreach($html->find('div#gbar') as $e) echo $e->innertext . '
'; // find all span tags with class=gb1 foreach($html->find('span.gb1') as $e) echo $e->outertext . '
'; // find all td tags with attribite align=center foreach($html->find('td[align=center]') as $e) echo $e->innertext . '
'; // extract text from table echo $html->find('td[align="center"]',1)->plaintext.'
'; // extract text from HTML echo $html->plaintext; ?>
更多关于PHP相关内容感兴趣的读者可查看本站专题:《》、《》、《》、《》、《》、《》、《》、《》及《PHP常见数据库操作技巧汇总》
希望本文所述对大家PHP程序设计有所帮助。