@H_301_0@本文将使用nodeJS实现一个简单的网页爬虫功能
@H_3010@<span style="background-color: #ccffcc">
网页源码
@H301_0@使用http.get()方法获取网页源码,以hao123网站的头条页面为例
@H_301_0@http://tuijian.hao123.com/hotrank
<div class="jb51code">
<pre class="brush:xhtml;">
var http = require('http');
http.get('http://tuijian.hao123.com/hotrank',function(res){
var data = '';
res.on('data',function(chunk){
data += chunk;
});
res.on('end',function(){
console.log(data);
})
});