侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

php使用curl下载指定大小的文件实例代码

php  /  管理员 发布于 7年前   262

php中使用基于libcurl的curl函数,可以对目标url发起http请求并获取返回的响应内容。通常的请求方式类似如下的代码:

public function callFunction($url, $postData, $method, header=''){  $maxRetryTimes = 3;  $curl = curl_init();  /******初始化请求参数start******/  if(strtoupper($method) !== 'GET' && $postData){    curl_setopt($curl, CURLOPT_POSTFIELDS, json_encode($postData));  }elseif (strtoupper($method) === 'GET' && $postData){    $url .= '?'. http_build_query($postData);  }  /******初始化请求参数end******/  curl_setopt_array($curl, array(    CURLOPT_URL => $url,    CURLOPT_TIMEOUT => 10,    CURLOPT_NOBODY => 0,    CURLOPT_RETURNTRANSFER => 1  ));  if(method == 'POST'){    curl_setopt($curl, CURLOPT_POST, true);  }  if(false == empty()){    curl_setopt($curl, CURLOPT_HTTPHEADER, $header);  }  $response = false;  while(($response === false) && (--$maxRetryTimes > 0)){    $response = trim(curl_exec($curl));  }  return $response;}

上面代码中的这个$response是curl发起的这次http请求从$url获取到的数据,如果没有在$header中通过range来指定要下载的大小,无论这个资源多大,那么都要请求完整的并返回的是这个URI的完整内容。通常只用curl来请求求一些接口或者远程调用一个函数获取数据,,所以这个场景下CURLOPT_TIMEOUT这个参数很重要。

对于curl的使用场景不止访问数据接口,还要对任意的url资源进行检测是否能提供正确的http服务。当用户填入的url是一个资源文件时,例如一个pdf或者ppt之类的,这时候如果网络状况较差的情况下用curl请求较大的资源,将不可避免的出现超时或者耗费更多的网络资源。之前的策略是完全下载(curl会下载存储在内存中),请求完后检查内容大小,当超过目标值就把这个监控的任务暂停。这样事发后限制其实治标不治本,终于客户提出了新的需求,不能停止任务只下载指定大小的文件并返回md5值由客户去校验正确性。

经过了一些尝试,解决了这个问题,记录过程如下文。

1、尝试使用 CURLOPT_MAXFILESIZE。

对php和libcurl的版本有版本要求,完全的事前处理,当发现目标大于设置时,直接返回了超过大小限制的错误而不去下载目标了,不符合要求。

2、使用curl下载过程的回调函数。

参考 http://php.net/manual/en/function.curl-setopt-array.php ,最终使用了CURLOPT_WRITEFUNCTION参数设置了on_curl_write,该函数将会1s中被回调1次。

$ch = curl_init();$options = array(CURLOPT_URL    => 'http://www.php.net/',CURLOPT_HEADER    => false,CURLOPT_HEADERFUNCTION  => 'on_curl_header',CURLOPT_WRITEFUNCTION  => 'on_curl_write');

最终我的实现片段:

function on_curl_write($ch, $data){  $pid = getmypid();  $downloadSizeRecorder = DownloadSizeRecorder::getInstance($pid);  $bytes = strlen($data);  $downloadSizeRecorder->downloadData .= $data;  $downloadSizeRecorder->downloadedFileSize += $bytes;//  error_log(' on_curl_write '.$downloadSizeRecorder->downloadedFileSize." > {$downloadSizeRecorder->maxSize} \n", 3, '/tmp/hyb.log');  //确保已经下载的内容略大于最大限制  if (($downloadSizeRecorder->downloadedFileSize - $bytes) > $downloadSizeRecorder->maxSize) {    return false;  }  return $bytes; //这个不正确的返回,将会报错,中断下载 "errno":23,"errmsg":"Failed writing body (0 != 16384)"}

DownloadSizeRecorder是一个单例模式的类,curl下载时记录大小,实现返回下载内容的md5等。

class DownloadSizeRecorder{  const ERROR_FAILED_WRITING = 23; //Failed writing body  public $downloadedFileSize;  public $maxSize;  public $pid;  public $hasOverMaxSize;  public $fileFullName;  public $downloadData;  private static $selfInstanceList = array();  public static function getInstance($pid)  {    if(!isset(self::$selfInstanceList[$pid])){      self::$selfInstanceList[$pid] = new self($pid);    }    return self::$selfInstanceList[$pid];  }  private function __construct($pid)  {    $this->pid = $pid;    $this->downloadedFileSize = 0;    $this->fileFullName = '';    $this->hasOverMaxSize = false;    $this->downloadData = '';  }  /**   * 保存文件   */  public function saveMaxSizeData2File(){    if(empty($resp_data)){      $resp_data = $this->downloadData;    }    $fileFullName = '/tmp/http_'.$this->pid.'_'.time()."_{$this->maxSize}.download";    if($resp_data && strlen($resp_data)>0)    {      list($headerOnly, $bodyOnly) = explode("\r\n\r\n", $resp_data, 2);      $saveDataLenth = ($this->downloadedFileSize < $this->maxSize) ? $this->downloadedFileSize : $this->maxSize;      $needSaveData = substr($bodyOnly, 0, $saveDataLenth);      if(empty($needSaveData)){        return;      }      file_put_contents($fileFullName, $needSaveData);      if(file_exists($fileFullName)){        $this->fileFullName = $fileFullName;      }    }  }  /**   * 返回文件的md5   * @return string   */  public function returnFileMd5(){    $md5 = '';    if(file_exists($this->fileFullName)){      $md5 = md5_file($this->fileFullName);    }    return $md5;  }  /**   * 返回已下载的size   * @return int   */  public function returnSize(){    return ($this->downloadedFileSize < $this->maxSize) ? $this->downloadedFileSize : $this->maxSize;  }  /**   * 删除下载的文件   */  public function deleteFile(){    if(file_exists($this->fileFullName)){      unlink($this->fileFullName);    }  }}

curl请求的代码实例中,实现限制下载大小

……curl_setopt($ch, CURLOPT_WRITEFUNCTION, 'on_curl_write');//设置回调函数……$pid = getmypid();$downloadSizeRecorder = DownloadSizeRecorder::getInstance($pid);$downloadSizeRecorder->maxSize = $size_limit;……//发起curl请求$response = curl_exec($ch);……//保存文件,返回md5$downloadSizeRecorder->saveMaxSizeData2File(); //保存$downloadFileMd5 = $downloadSizeRecorder->returnFileMd5();$downloadedfile_size = $downloadSizeRecorder->returnSize();$downloadSizeRecorder->deleteFile();

到这里,踩了一个坑。增加了on_curl_write后,$response会返回true,导致后面取返回内容的时候异常。好在已经实时限制了下载的大小,用downloadData来记录了已经下载的内容,直接可以使用。

if($response === true){  $response = $downloadSizeRecorder->downloadData;}

总结

以上所述是小编给大家介绍的php使用curl下载指定大小的文件,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对站的支持!

您可能感兴趣的文章:

  • php使用curl实现ftp文件下载功能
  • php使用curl模拟浏览器表单上传文件或者图片的方法
  • PHP使用curl请求实现post方式上传图片文件功能示例
  • PHP实现通过CURL上传文件功能示例
  • 可兼容php5与php7的cURL文件上传功能实例分析
  • PHP5.0~5.6 各版本兼容性cURL文件上传功能实例分析
  • PHP使用curl模拟post上传及接收文件的方法
  • php curl 上传文件代码实例
  • php下利用curl判断远程文件是否存在的实现代码
  • PHP使用CURL实现下载文件功能示例


  • 上一条:
    PHP基于自定义函数生成笛卡尔积的方法示例
    下一条:
    PHP 获取 ping 时间的实现方法
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • Laravel从Accel获得5700万美元A轮融资(0个评论)
    • PHP 8.4 Alpha 1现已发布!(0个评论)
    • 用Time Warden监控PHP中的代码处理时间(0个评论)
    • 在PHP中使用array_pop + yield实现读取超大型目录功能示例(0个评论)
    • Property Hooks RFC在PHP 8.4中越来越接近现实(0个评论)
    • 近期文章
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf文件功能(0个评论)
    • Laravel从Accel获得5700万美元A轮融资(0个评论)
    • 在go + gin中gorm实现指定搜索/区间搜索分页列表功能接口实例(0个评论)
    • 在go语言中实现IP/CIDR的ip和netmask互转及IP段形式互转及ip是否存在IP/CIDR(0个评论)
    • PHP 8.4 Alpha 1现已发布!(0个评论)
    • Laravel 11.15版本发布 - Eloquent Builder中添加的泛型(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2017-06
    • 2017-07
    • 2017-08
    • 2017-09
    • 2017-11
    • 2017-12
    • 2018-01
    • 2018-02
    • 2018-03
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2020-07
    • 2020-09
    • 2021-02
    • 2021-03
    • 2021-04
    • 2021-05
    • 2021-06
    • 2021-07
    • 2021-08
    • 2021-09
    • 2021-10
    • 2021-11
    • 2021-12
    • 2022-01
    • 2022-02
    • 2022-05
    • 2022-06
    • 2022-07
    • 2022-08
    • 2022-09
    • 2022-10
    • 2022-11
    • 2022-12
    • 2023-01
    • 2023-02
    • 2023-03
    • 2023-04
    • 2023-05
    • 2023-06
    • 2023-07
    • 2023-08
    • 2023-09
    • 2023-10
    • 2023-11
    • 2023-12
    • 2024-01
    • 2024-02
    • 2024-03
    • 2024-04
    • 2024-05
    • 2024-06
    • 2024-07
    • 2024-09
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客