PHP 实现断点续传的原理和方法

0. http协议从1.1开始支持静态获取文件的部分内容,为多线程下载和断点续传提供了技术支持。它通过在Header里两个参数实现的,客户端发请求时对应的是Accept-Range ,服务器端响应时对应的是 Content-Range。

1. 具体的请求和响应格式是这样: 资料来源 http://www.liqwei.com/network/protocol/2011/886.shtml

Range

用于请求头中,指定第一个字节的位置和最后一个字节的位置,一般格式:

Range:(unit=first byte pos)-[last byte pos]

Content-Range

用于响应头,指定整个实体中的一部分的插入位置,他也指示了整个实体的长度。在服务器向客户返回一个部分响应,它必须描述响应覆盖的范围和整个实体长度。一般格式:

Content-Range: bytes (unit first byte pos) - [last byte pos]/[entity legth]

请求下载整个文件:

    GET /test.rar HTTP/1.1
    Connection: close
    Host: 116.1.219.219
    Range: bytes=0-801 //一般请求下载整个文件是bytes=0- 或不用这个头

一般正常回应

    HTTP/1.1 200 OK
    Content-Length: 801
    Content-Type: application/octet-stream
    Content-Range: bytes 0-800/801 //801:文件总大小

2. 问题及应对

有些虚拟机配置时它是不支持断点传输的,下载时不显示总大小和进度条,只能看到下载了多少,甚至是一直处于 0 ,直到下载完成,这在下载文件时很不爽;此外,服务器对 apk 文件类型没有指明是 Content-type: application/octet-stream ,造成火狐浏览器对安卓应用 apk 以文本方式输入,这是不是更不方便。

基于此,有必要通过 PHP 对这种特殊的情况作处理,方法是浏览器给这个 PHP 脚本发送 GET 请求下载文件,PHP 脚本给浏览器响应的 header 中包含 Content-Type: application/octet-stream 和 Content-Range: bytes 0-800/801 即可。同时须用 flush() 函数刷新浏览器的cache ,就能看到下载了多少,否则下载大小一直处于 0

3. 实例

既然思路有了,具体的代码或许很简单。我们只需处理服务端,无需理会客户端发了什么请求

<?php

set_time_limit(0);                                                 // 这个必须有
$filename = $_GET['appid'];                                        // 接受的GET请求参数,其值为服务器上的文件
if(file_exists($filename)) die("该文件不存在");                    // 如果文件不存在,则终止脚本
$fileinfo = pathinfo($filename);                                   // 分析请求的值
$size = filesize($filename);                                       // 计算文件的大小
$size2 = $size-1;

header('Content-Range: bytes 0-' . $size2 . '/' . $size);          // 返回内容范围,断点续传
header('Content-Type: application/octet-stream');                  // 文件类型强制为二进制
#header('Content-Type: application/x-'.$fileinfo['extension']);    // 或许这样也可以
header('Content-Type: multipart/byteranges');                      // 多段传输
header('Content-Length: '. $size);                                 // 文件的总大小
// 提示用户保存,当 application/octet-stream 被使用时,任何类型的文件均被下载,不被浏览器打开。
header('Content-Disposition: attachment; filename='.$fileinfo['basename']);

flush();                          // 刷新浏览器的cache
readfile($filename);              // 读取文件
exit(0);

4. 现成的函数  资料来源 http://www.cnblogs.com/lq527/p/6228577.html

修正了  header('Content-Type: application/octet-stream');

header('Accenpt-Ranges: bytes');

Content-Dispositon

<?php
/**
 * PHP-HTTP断点续传实现
 * @param string $path: 文件所在路径
 * @param string $file: 文件名
 * @return void
 */
function download($path,$file) {
  $real = $path.'/'.$file;
  if(!file_exists($real)) {
    return false;
  }
  $size = filesize($real);
  $size2 = $size-1;
  $range = 0;
  if(isset($_SERVER['HTTP_RANGE'])) {   //http_range表示请求一个实体/文件的一个部分,用这个实现多线程下载和断点续传!
    header('HTTP /1.1 206 Partial Content');
    $range = str_replace('=','-',$_SERVER['HTTP_RANGE']);
    $range = explode('-',$range);
    $range = trim($range[1]);
    header('Content-Length:'.$size);
    header('Content-Range: bytes '.$range.'-'.$size2.'/'.$size);
  } else {
    header('Content-Length:'.$size);
    header('Content-Range: bytes 0-'.$size2.'/'.$size);
  }
  header('Accenpt-Ranges: bytes');
  header('Content-Type: application/octet-stream');
  header("Cache-control: public");
  header("Pragma: public");
  //解决在IE中下载时中文乱码问题
  $ua = $_SERVER['HTTP_USER_AGENT'];
  if(preg_match('/MSIE/',$ua)) {    //表示正在使用 Internet Explorer。
    $ie_filename = str_replace('+','%20',urlencode($file));
    header('Content-Disposition:attachment; filename='.$ie_filename);
  } else {
    header('Content-Disposition:attachment; filename='.$file);
  }
  $fp = fopen($real,'rb+');
  fseek($fp,$range);                //fseek:在打开的文件中定位,该函数把文件指针从当前位置向前或向后移动到新的位置,新位置从文件头开始以字节数度量。成功则返回 0;否则返回 -1。注意,移动到 EOF 之后的位置不会产生错误。
  while(!feof($fp)) {               //feof:检测是否已到达文件末尾 (eof)
    set_time_limit(0);              //注释①
    print(fread($fp,1024));         //读取文件(可安全用于二进制文件,第二个参数:规定要读取的最大字节数)
    ob_flush();                     //刷新PHP自身的缓冲区
     flush();                       //刷新缓冲区的内容(严格来讲, 这个只有在PHP做为apache的Module(handler或者filter)安装的时候, 才有实际作用. 它是刷新WebServer(可以认为特指apache)的缓冲区.)
  }
  fclose($fp);
}

5. Apache2 开启断点续传

在httpd.conf中尝试mod_headers: Header set Accept-Ranges bytes

#开启Accept-Ranges响应头

<IfModule mod_headers.c>
 Header set Accept-Ranges bytes
</IfModule>

Lighttpd用户尝试在lighttpd.conf中进行下面的配置:

## enabled for all file types
##server.range-requests = "enable"
## But, disable it for pdf files
##$HTTP["url"] =~ "\.pdf$" {  server.range-requests = "disable"}

6. 资料参考

http断点续传原理:http头 Range、Content-Range   http://www.liqwei.com/network/protocol/2011/886.shtml

HTTP Header里的Range和Content-Range参数         http://www.tuicool.com/articles/RBrMnen

php支持断点续传的文件下载类                     http://www.tuicool.com/articles/eMr2Ufq

PHP实现HTTP断点续传的方法                       http://www.cnblogs.com/lq527/p/6228577.html

HTTP状态码详解                                  http://tool.oschina.net/commons?type=5

PHP 实现断点续传的原理和方法的更多相关文章

  1. .net断点续传的原理

    在了解HTTP断点续传的原理之前,先来说说HTTP协议,HTTP协议是一种基于tcp的简单协议,分为请求和回复两种.请求协议是由客户机(浏览器)向服务器(WEB SERVER)提交请求时发送报文的协议 ...

  2. fMRI数据分析处理原理及方法(转载)

    原文地址:http://www.cnblogs.com/minks/p/4889497.html 近年来,血氧水平依赖性磁共振脑功能成像(Blood oxygenation level-depende ...

  3. fMRI数据分析处理原理及方法

    来源: 整理文件的时候翻到的,来源已经找不到了囧感觉写得还是不错,贴在这里保存. 近年来,血氧水平依赖性磁共振脑功能成像(Blood oxygenation level-dependent funct ...

  4. 客户端HTTP断点续传的原理

    其实断点续传的原理很简单,就是在Http的请求上和一般的下载有所不同而已. 打个比方,浏览器请求服务器上的一个文时,所发出的请求如下:假设服务器域名为wwww.scu.edu.cn,文件名为down. ...

  5. Atitit.实现继承的原理and方法java javascript .net c# php ...

    Atitit.实现继承的原理and方法java javascript .net c# php ... 1. 实现继承的问题 1 2. 如何拷贝基类方法?采用prototype原型方式,通过冒充对象 1 ...

  6. Oracle中的SQL分页查询原理和方法详解

    Oracle中的SQL分页查询原理和方法详解 分析得不错! http://blog.csdn.net/anxpp/article/details/51534006

  7. 数据融合(data fusion)原理与方法

    数据融合(data fusion)原理与方法 数据融合(data fusion)最早被应用于军事领域.     现在数据融合的主要应用领域有:多源影像复合.机器人和智能仪器系统.战场和无人驾驶飞机.图 ...

  8. fMRI数据分析处理原理及方法————转自网络

    fMRI数据分析处理原理及方法 来源: 整理文件的时候翻到的,来源已经找不到了囧感觉写得还是不错,贴在这里保存. 近年来,血氧水平依赖性磁共振脑功能成像(Blood oxygenation level ...

  9. HTTP文件断点续传的原理

    前几天一个同事跑过来找我说,我们在广告素材视频这块想做断点续传,就是这次某个视频缓存到一半,下次不用重头开始,可以在原来停留得位置开始继续下载.以提供更好的用户体验. 同时说需要我们支持吐素材地址的业 ...

随机推荐

  1. 紫书 例题 10-18 UVa 11346(连续概率)

    就是面积计算,没什么好说的. #include<cstdio> #include<cmath> #define REP(i, a, b) for(int i = (a); i ...

  2. Redis序列化存储Java集合List等自定义类型

    在"Redis学习总结和相关资料"http://blog.csdn.net/fansunion/article/details/49278209 这篇文章中,对Redis做了总体的 ...

  3. HTML学习----------DAY1 第三节

    本章通过实例向您演示最常用的 HTML 标签. 提示:不要担心本章中您还没有学过的例子,您将在下面的章节中学到它们. 提示:学习 HTML 最好的方式就是边学边做实验.我们为您准备了很好的 HTML ...

  4. volatile的含义

    从词面上来讲.volatile的意思是易变的,也就是说.在程序执行的过程中,有一些变量可能会被莫名其妙的改变,而优化器为了节约时间.有时候不会重读这个变量的真实值,而是去读在寄存器的备份,这种话,这个 ...

  5. POJ 3622 multiset

    思路: 放一个链接 是我太懒了 http://blog.csdn.net/mars_ch/article/details/52835978 嗯她教的我(姑且算是吧) (一通乱搞就出来了-) //By ...

  6. HDU 5446 Unknown Treasure Lucas+中国剩余定理+按位乘

    HDU 5446 Unknown Treasure 题意:求C(n, m) %(p[1] * p[2] ··· p[k])     0< n,m < 1018 思路:这题基本上算是模版题了 ...

  7. Android自定义组件系列【16】——最帅气的自动滚动广告条

    前一段时间要实现一个滚动的广告条,参考了一下网上许多实现,发现实现都很麻烦,所以我决定自己使用ViewFlipper来实现一个,在此将代码贴出来,与大家共享. 转载请说明出处:http://blog. ...

  8. c# 导出excel格式xlsx

    string sb="";//sql字符串 AttachmentConfigSection configSection = ConfigurationManager.GetSect ...

  9. Network Stack

    Network Stack 目录 1 Overview 2 Code Layout 3 Anatomy of a Network Request (focused on HTTP) 3.1 URLRe ...

  10. 实际运用中DataSet、DataTable、DataRow点滴

    DataSet.DataTable都自带有序列化标记,但是DataRow没有, 所以如果是在CS程序中,Release版本程序DataTable才是最小的数据传输单元,如果使用DataRow则会报[未 ...