频道导航

thinkphp 抓取网站的内容并且保存到本地的实例详解

2018-12-30 ThinkPHP 前端之家

前端之家收集整理的这篇文章主要介绍了thinkphp 抓取网站的内容并且保存到本地的实例详解，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

thinkPHP 抓取网站的内容并且保存到本地的实例详解

我需要写这么一个例子，到电子课本网下载一本电子书。

电子课本网的电子书，是把书的每一页当成一个图片，然后一本书就是有很多张图片，我需要批量的进行下载图片操作。

下面是代码部分：

do {
  $filename = substr("000".$i,-3).".htm";
  $ch = curl_init();
  curl_setopt($ch,CURLOPT_URL,$url_pref.$filename);
  curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
  curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,10);
  curl_setopt($ch,CURLOPT_FOLLOWLOCATION,1);
  $html = curl_exec($ch);
  curl_close($ch);

  $result = preg_match_all($reg,$html,$out,PREG_PATTERN_ORDER);
  if($result==1) {
    $picUrl = $out[1][0];
    $picFilename = substr("000".$i,-3).".jpg";
    $http->curlDownload($picUrl,$localUrl.$picFilename);
  }
  $i = $i+1;
} while ($result==1);

echo "下载完成";

}

我这里是以人教版地理七年级地理上册为例子 http://www.dzkbw.com/books/rjb/dili/xc7s/001.htm

网页是从001.htm开始，然后数字一直加

每个网页里面都有一张图，就是对应课本的内容，以图片的形式展示课本内容

我的代码是做了一个循环，从第一页开始抓，一直抓到找不到网页里的图片为止

抓到网页的内容后，把网页里面的图片抓取到本地服务器

抓取后的实际效果：

以上就是thinkPHP 抓取网站的内容并且保存到本地的实例详解，如有疑问请留言或者到本站社区交流讨论，感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

上一篇：thinkPHP3.0框架实现模板保存到数据下一篇：thinkphp ajaxfileupload实现异步上

猜你在找的ThinkPHP相关文章

Thinkphp 缓存微信jssdk相关认证参数

public function getapiSignature(){$access_token=S('access_token');//...

作者：前端之家时间：2021-02-18

用户登陆模块的后端实现

前述两篇文章“使用BootStrap制作用户登录UI”和“使用BootStrapValidator来完成前端输入验...

作者：前端之家时间：2021-02-18

在ThinkPHP3.x框架中实现将原创文章第一时间推送到百度收录

前两天自己写的一篇文章“针对BootStrap中tabs控件的美化和完善”被别的网站给转载了，这也...

作者：前端之家时间：2021-02-18

ThinkPHP5中Session的使用

由于用惯了ThinkPHP之前的版本，一想到要用Session就直接用$_SESSION来存取，今天看了Thin...

作者：前端之家时间：2021-02-18

空间session失效的解决方法

今天访问自己的网站的时候（by thinkphp），突然发现身份验证失效了，Session无法跨页，而...

作者：前端之家时间：2021-02-18

tp6省略url里的index.php

加个问号就行了

作者：前端之家时间：2020-11-07

thinkphp无限分类模块实现

数据表结构如下：控制器核心代码： <?php namespace appindexcontroller; use thi...

作者：前端之家时间：2020-11-07

thinkphp5.1在php7.3下使用phpmailer报错

thinkphp5.1在php7.3下使用phpmailer报错： unable to select [11]: Resource temporarily...

作者：前端之家时间：2020-11-07

thinkphp--控制器怎么分配变量到公共模板

应该是有很多种解决方法，我这边提供一个思路定义一个公共控制器Base，其他控制器都继承自...

作者：前端之家时间：2020-11-07

tp5写入cookie失效

打算统计网站uv，使用cookie来实现原先错误代码如下： // 获取UV function getUv(){ #当前...

作者：前端之家时间：2020-11-07

编程分类

PHP Java Java SE Python C#C&C++Ruby VB asp.Net Go Perl netty Django Delphi Jsp .NET Core Spring Flask Springboot SpringMVC Lua Laravel Mybatis Asp Groovy ThinkPHP Yii swoole

最新文章