php zip 文件比較类,比較两个zip文件的内容,返回新增,删除,及同样的文件列表。临时仅仅支持单层。

需求:上传一个zip文件,zip内有非常多图片文件。须要对图片文件进行一系列非常耗时的处理。当用户再更新zip文件时。推断zip内文件是否一致,仅仅处理不同的文件。这样可以节省资源与时间,因此须要编写一个可以比較zip内文件的类。

ZipCompare.class.php

<?php
/** Zip Compare class 比較两个zip文件的内容,返回新增,删除,及同样的文件列表,临时仅仅支持单层
* Date: 2014-05-18
* Author: fdipzone
* Ver: 1.0
*
* Func:
* public compare 比較zip文件内容
* private getInfo 获取zip内文件列表
* private parse 分析两个zip的文件内容
* private check 检查zip文件是否正确
* private check_handler 检查server是否有安装unzip
*/ class ZipCompare{ // class start /** 比較zip文件内容,列出不同样的部分
* @param String $zipfile1 zip文件1
* @param String $zipfile2 zip文件2
* @return Array
*/
public function compare($zipfile1, $zipfile2){ // 检查是否有安装unzip
if(!$this->check_handler()){
throw new Exception('unzip not install');
} // 检查zip文件
if(!$this->check($zipfile1) || !$this->check($zipfile2)){
throw new Exception('zipfile not exists or error');
} // 获取zip内文件列表
$zipinfo1 = $this->getInfo($zipfile1);
$zipinfo2 = $this->getInfo($zipfile2); // 分析两个zip的文件内容,返回同样及不同的文件列表
return $this->parse($zipinfo1, $zipinfo2); } /** 获取zip内文件列表
* @param String $zipfile zip文件
* @return Array zip内文件列表
*/
private function getInfo($zipfile){ // unzip -v fields
$fields = array('Length','Method','Size','Cmpr','Date','Time','CRC-32','Name'); // zip verbose
$verbose = shell_exec(sprintf("unzip -v %s | sed '\$d' | sed '\$d' | sed -n '4,\$p'", $zipfile)); // zip info
$zipinfo = array(); $filelist = explode("\n", $verbose); if($filelist){
foreach($filelist as $rowdata){
if($rowdata==''){
continue;
}
$rowdata = preg_replace('/[ ]{2,}/', ' ', $rowdata); // 将两个或以上空格替换为一个
$tmp = array_slice(explode(' ', $rowdata), 1); // 去掉第一个空格 $file = array_combine($fields, $tmp); $zipinfo[$file['Name']] = $file['Length'].'_'.$file['CRC-32']; // 文件名称,长度,CRC32,用于校验
}
} return $zipinfo; } /** 分析两个zip文件内容
* @param String $zipinfo1
* @param String $zipinfo2
* @return Array
*/
private function parse($zipinfo1, $zipinfo2){ $result = array(
'add' => array(), // 新增
'del' => array(), // 缺少
'match' => array() // 匹配
); if($zipinfo1 && $zipinfo2){ // 在zip1但不在zip2的文件
$result['add'] = array_values(array_diff(array_keys($zipinfo1), array_keys($zipinfo2))); // 在zip2但不在zip1的文件
$result['del'] = array_values(array_diff(array_keys($zipinfo2), array_keys($zipinfo1))); // 同一时候在zip1与zip2的文件
$match_file = array_values(array_diff(array_keys($zipinfo1), $result['add'])); // 检查同样文件名称的文件内容是否匹配
for($i=0,$len=count($match_file); $i<$len; $i++){ if($zipinfo1[$match_file[$i]]==$zipinfo2[$match_file[$i]]){ // match
array_push($result['match'], $match_file[$i]);
}else{ // not match, change to add
array_push($result['add'], $match_file[$i]);
} } } return $result; } /** 检查zip文件是否正确
* @param String $zipfile zip文件
* @return boolean
*/
private function check($zipfile){
// 文件存在且能解压
return file_exists($zipfile) && shell_exec(sprintf('unzip -v %s | wc -l', $zipfile))>1;
} /** 检查server是否有安装unzip
* @return boolean
*/
private function check_handler(){
return strstr(shell_exec('unzip -v'), 'version')!='';
} } // class end ?>

demo

<?php

require "ZipCompare.class.php";

$obj = new ZipCompare();
$result = $obj->compare('test1.zip','test2.zip'); print_r($result); ?>

运行后输出:

Array
(
[add] => Array
(
[0] => 9.jpg
) [del] => Array
(
[0] => 5.jpg
[1] => 6.jpg
[2] => 7.jpg
[3] => 8.jpg
) [match] => Array
(
[0] => 1.jpg
[1] => 10.jpg
[2] => 11.jpg
[3] => 12.jpg
[4] => 13.jpg
[5] => 14.jpg
[6] => 15.jpg
[7] => 16.jpg
[8] => 17.jpg
[9] => 18.jpg
[10] => 2.jpg
[11] => 3.jpg
[12] => 4.jpg
) )

源代码下载地址:点击查看

php zip文件内容比較类的更多相关文章

  1. 011PHP文件处理——文件处理 文件内容分页操作类

    <?php /** * 文件内容分页操作类: */ //访问地址:http://basicphp.com/006file/011.php?&page=1 class StrPage { ...

  2. 解决gvim 8.1中zip插件打开zip文件内容时,而文件路径带有空格的问题。

    解决gvim 8.1中zip插件打开zip文件内容时,而文件路径带有空格的问题. 现象是只能打开一次,第二次打开就显示为空了. 通过 lcd切换工作目录.使得命令行操作中不再有带空格的路径 vim81 ...

  3. 读取Zip文件内容

    第一步,上次文件并保存到服务器目录下 /// <summary> /// 上传压缩文件 /// </summary> protected void UploadZip() { ...

  4. zip文件解压工具类

    java解压zip文件 import java.io.BufferedInputStream; import java.io.BufferedOutputStream; import java.io. ...

  5. Web API 自定义文件内容的定制类

    public class FileContent : HttpContent { private readonly Stream _stream; public FileContent(string ...

  6. Java文件编码自动转换工具类(只改变编码,不会改变文件内容)

    本篇随笔主要介绍了一个用java语言写的将一个文件编码转换为另一个编码并不改变文件内容的工具类: 通过读取源文件内容,用URLEncoding重新编码解码的方式实现. public class Cha ...

  7. 工具类_JavaPOI_Office文件内容读取

    文件内容读取工具类,亲测可用 maven依赖: <dependency> <groupId>org.apache.poi</groupId> <artifac ...

  8. 【.NET深呼吸】Zip文件操作(1):创建和读取zip文档

    .net的IO操作支持对zip文件的创建.读写和更新.使用起来也比较简单,.net的一向作风,东西都准备好了,至于如何使用,请看着办. 要对zip文件进行操作,主要用到以下三个类: 1.ZipFile ...

  9. 8.5 filecmp--文件和文件夹比較处理

    本模块主要提供了对文件和文件夹进行简单的比較处理,假设须要复杂的文件比較须要使用difflib库来处理. filecmp.cmp(f1, f2, shallow=True) 比較文件f1和文件f2,当 ...

随机推荐

  1. c#常见stream操作

    原文: c#常见stream操作 常见并常用的stream一共有 文件流(FileStream), 内存流(MemoryStream), 压缩流(GZipStream), 加密流(CrypToStre ...

  2. Hibernate学习之createSQLQuery与createQuery的区别及使用

    hibernate中createQuery与createSQLQuery:前者用的hql语句进行查询,后者可以用sql语句查询,前者以hibernate生成的Bean为对象装入list返回,后者则是以 ...

  3. hdu4908(中位数)

    传送门:BestCoder Sequence 题意:给一个序列,里面是1-N的排列,给出m,问以m为中位数的奇数长度的序列个数. 分析:先找出m的位置,再记录左边比m大的状态,记录右边比m大的状态,使 ...

  4. 自己定义控件(2.2):SurfaceView和SurfaceHolder

    本例需求及流程: Activity载入自己定义的SurfaceView-> SurfaceView 构造器中启动线程A.循环改变SurfaceView的x,y坐标,当x,y坐标到某点时设渐显标志 ...

  5. hdu1876(dp)

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1876 题意:问机器人到达终点的过程中最多有几次完全消耗完能量,消耗完这么多次能量的方式有几种. 分析: ...

  6. BASH Shell 简易进度条小函数

    不多说,直接上脚本. # processbar <current> <total> processbar() { local current=$1; local total=$ ...

  7. SE 2014年5月9日

    两企业接入到 Internet(A公司和B公司),企业内部的用户及服务器均能够访问到 Internet. 2. A公司规模较大,采用了接入层/汇聚层/核心层的划分模式,接入层划分了多vLan(如图), ...

  8. Compass用法指南

    Compass用法指南   Sass是一种"CSS预处理器",可以让CSS的开发变得简单和可维护.但是,只有搭配Compass,它才能显出真正的威力. 本文介绍Compass的用法 ...

  9. FUDCon - FedoraProject

    FUDCon - FedoraProject FUDCon: Fedora Users and Developers Conference FUD: An acronym for Fear, Unce ...

  10. Knockout应用开发指南 第三章:绑定语法(2)

    原文:Knockout应用开发指南 第三章:绑定语法(2) 7   click 绑定 目的 click绑定在DOM元素上添加事件句柄以便元素被点击的时候执行定义的JavaScript 函数.大部分是用 ...