php zip 文件比較类,比較两个zip文件的内容,返回新增,删除,及同样的文件列表。临时仅仅支持单层。

需求:上传一个zip文件,zip内有非常多图片文件。须要对图片文件进行一系列非常耗时的处理。当用户再更新zip文件时。推断zip内文件是否一致,仅仅处理不同的文件。这样可以节省资源与时间,因此须要编写一个可以比較zip内文件的类。

ZipCompare.class.php

<?php
/** Zip Compare class 比較两个zip文件的内容,返回新增,删除,及同样的文件列表,临时仅仅支持单层
* Date: 2014-05-18
* Author: fdipzone
* Ver: 1.0
*
* Func:
* public compare 比較zip文件内容
* private getInfo 获取zip内文件列表
* private parse 分析两个zip的文件内容
* private check 检查zip文件是否正确
* private check_handler 检查server是否有安装unzip
*/ class ZipCompare{ // class start /** 比較zip文件内容,列出不同样的部分
* @param String $zipfile1 zip文件1
* @param String $zipfile2 zip文件2
* @return Array
*/
public function compare($zipfile1, $zipfile2){ // 检查是否有安装unzip
if(!$this->check_handler()){
throw new Exception('unzip not install');
} // 检查zip文件
if(!$this->check($zipfile1) || !$this->check($zipfile2)){
throw new Exception('zipfile not exists or error');
} // 获取zip内文件列表
$zipinfo1 = $this->getInfo($zipfile1);
$zipinfo2 = $this->getInfo($zipfile2); // 分析两个zip的文件内容,返回同样及不同的文件列表
return $this->parse($zipinfo1, $zipinfo2); } /** 获取zip内文件列表
* @param String $zipfile zip文件
* @return Array zip内文件列表
*/
private function getInfo($zipfile){ // unzip -v fields
$fields = array('Length','Method','Size','Cmpr','Date','Time','CRC-32','Name'); // zip verbose
$verbose = shell_exec(sprintf("unzip -v %s | sed '\$d' | sed '\$d' | sed -n '4,\$p'", $zipfile)); // zip info
$zipinfo = array(); $filelist = explode("\n", $verbose); if($filelist){
foreach($filelist as $rowdata){
if($rowdata==''){
continue;
}
$rowdata = preg_replace('/[ ]{2,}/', ' ', $rowdata); // 将两个或以上空格替换为一个
$tmp = array_slice(explode(' ', $rowdata), 1); // 去掉第一个空格 $file = array_combine($fields, $tmp); $zipinfo[$file['Name']] = $file['Length'].'_'.$file['CRC-32']; // 文件名称,长度,CRC32,用于校验
}
} return $zipinfo; } /** 分析两个zip文件内容
* @param String $zipinfo1
* @param String $zipinfo2
* @return Array
*/
private function parse($zipinfo1, $zipinfo2){ $result = array(
'add' => array(), // 新增
'del' => array(), // 缺少
'match' => array() // 匹配
); if($zipinfo1 && $zipinfo2){ // 在zip1但不在zip2的文件
$result['add'] = array_values(array_diff(array_keys($zipinfo1), array_keys($zipinfo2))); // 在zip2但不在zip1的文件
$result['del'] = array_values(array_diff(array_keys($zipinfo2), array_keys($zipinfo1))); // 同一时候在zip1与zip2的文件
$match_file = array_values(array_diff(array_keys($zipinfo1), $result['add'])); // 检查同样文件名称的文件内容是否匹配
for($i=0,$len=count($match_file); $i<$len; $i++){ if($zipinfo1[$match_file[$i]]==$zipinfo2[$match_file[$i]]){ // match
array_push($result['match'], $match_file[$i]);
}else{ // not match, change to add
array_push($result['add'], $match_file[$i]);
} } } return $result; } /** 检查zip文件是否正确
* @param String $zipfile zip文件
* @return boolean
*/
private function check($zipfile){
// 文件存在且能解压
return file_exists($zipfile) && shell_exec(sprintf('unzip -v %s | wc -l', $zipfile))>1;
} /** 检查server是否有安装unzip
* @return boolean
*/
private function check_handler(){
return strstr(shell_exec('unzip -v'), 'version')!='';
} } // class end ?>

demo

<?php

require "ZipCompare.class.php";

$obj = new ZipCompare();
$result = $obj->compare('test1.zip','test2.zip'); print_r($result); ?>

运行后输出:

Array
(
[add] => Array
(
[0] => 9.jpg
) [del] => Array
(
[0] => 5.jpg
[1] => 6.jpg
[2] => 7.jpg
[3] => 8.jpg
) [match] => Array
(
[0] => 1.jpg
[1] => 10.jpg
[2] => 11.jpg
[3] => 12.jpg
[4] => 13.jpg
[5] => 14.jpg
[6] => 15.jpg
[7] => 16.jpg
[8] => 17.jpg
[9] => 18.jpg
[10] => 2.jpg
[11] => 3.jpg
[12] => 4.jpg
) )

源代码下载地址:点击查看

php zip文件内容比較类的更多相关文章

  1. 011PHP文件处理——文件处理 文件内容分页操作类

    <?php /** * 文件内容分页操作类: */ //访问地址:http://basicphp.com/006file/011.php?&page=1 class StrPage { ...

  2. 解决gvim 8.1中zip插件打开zip文件内容时,而文件路径带有空格的问题。

    解决gvim 8.1中zip插件打开zip文件内容时,而文件路径带有空格的问题. 现象是只能打开一次,第二次打开就显示为空了. 通过 lcd切换工作目录.使得命令行操作中不再有带空格的路径 vim81 ...

  3. 读取Zip文件内容

    第一步,上次文件并保存到服务器目录下 /// <summary> /// 上传压缩文件 /// </summary> protected void UploadZip() { ...

  4. zip文件解压工具类

    java解压zip文件 import java.io.BufferedInputStream; import java.io.BufferedOutputStream; import java.io. ...

  5. Web API 自定义文件内容的定制类

    public class FileContent : HttpContent { private readonly Stream _stream; public FileContent(string ...

  6. Java文件编码自动转换工具类(只改变编码,不会改变文件内容)

    本篇随笔主要介绍了一个用java语言写的将一个文件编码转换为另一个编码并不改变文件内容的工具类: 通过读取源文件内容,用URLEncoding重新编码解码的方式实现. public class Cha ...

  7. 工具类_JavaPOI_Office文件内容读取

    文件内容读取工具类,亲测可用 maven依赖: <dependency> <groupId>org.apache.poi</groupId> <artifac ...

  8. 【.NET深呼吸】Zip文件操作(1):创建和读取zip文档

    .net的IO操作支持对zip文件的创建.读写和更新.使用起来也比较简单,.net的一向作风,东西都准备好了,至于如何使用,请看着办. 要对zip文件进行操作,主要用到以下三个类: 1.ZipFile ...

  9. 8.5 filecmp--文件和文件夹比較处理

    本模块主要提供了对文件和文件夹进行简单的比較处理,假设须要复杂的文件比較须要使用difflib库来处理. filecmp.cmp(f1, f2, shallow=True) 比較文件f1和文件f2,当 ...

随机推荐

  1. 智能手机的工业控制应用方案——SimpleWiFi在工业控制领域应用

    智能手机的工业控制应用方案——SimpleWiFi在工业控制领域应用    先上图: 现在的智能控制都是基于微控制器,随着智能的手持终端的普及,基于智能终端的控制就会越来越普遍. WIFI便是其中的一 ...

  2. WeText项目的服务端

    WeText项目的服务端 在<WeText项目:一个基于.NET实现的DDD.CQRS与微服务架构的演示案例>文章中,我介绍了自己用Visual Studio 2015(C# 6.0 wi ...

  3. DHTML【10】--Javascript

    大家好,这一节主要介绍Javascript的函数.函数是Javascript的核心中的核心,这么强调一点都不过分,相信没有人反对,如果有人反对,你以后可以不用函数,呵呵,说的有点绝了啊. 下面看一下J ...

  4. zoj3471(状压dp)

    题目连接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=4257 题意:不超过10种气体,两两之间相互碰撞可以产生一定的能量,如 ...

  5. ORA-00210 ORA-15001 ORA-15055 ORA-01031: insufficient privileges

    ORA-00210: cannot open the specified control file ORA-00202: control file: &apos;+DATA/posdb/con ...

  6. 服务器编程入门(1)TCP/IP协议族

    问题聚焦: 简单地梳理一下TCP/IP各层的功能和常用协议 详细了解ARP(数据链路层)和DNS(应用层)协议的工作原理 1 TCP/IP协议族体系结构 数据链路层:     职责:实现网卡接口的网络 ...

  7. 啊我V办我偶看篇未改片考i

    http://pan.baidu.com/share/link?shareid=3011665141&uk=338692646&third=15                http ...

  8. HDU - 1588 Gauss Fibonacci (矩阵高速幂+二分求等比数列和)

    Description Without expecting, Angel replied quickly.She says: "I'v heard that you'r a very cle ...

  9. Linux智能小开关rfkill

    Linux智能小开关rfkill Rfkill,当中rf是Radio frequency(射频).主要作用是一个专门管理开关的子系统,举例说明Android手机的通知栏能够方便地开关Airplane/ ...

  10. zimbra启用SMTP认证并绑定认证登录和发件人

    1. smtp认证    1.1 修改mynetworks        登录zimbra后台-->全局配置-->MTA-->信任网络-->127.0.0.0/8        ...