php zip文件内容比較类
php zip 文件比較类,比較两个zip文件的内容,返回新增,删除,及同样的文件列表。临时仅仅支持单层。
需求:上传一个zip文件,zip内有非常多图片文件。须要对图片文件进行一系列非常耗时的处理。当用户再更新zip文件时。推断zip内文件是否一致,仅仅处理不同的文件。这样可以节省资源与时间,因此须要编写一个可以比較zip内文件的类。
ZipCompare.class.php
<?php
/** Zip Compare class 比較两个zip文件的内容,返回新增,删除,及同样的文件列表,临时仅仅支持单层
* Date: 2014-05-18
* Author: fdipzone
* Ver: 1.0
*
* Func:
* public compare 比較zip文件内容
* private getInfo 获取zip内文件列表
* private parse 分析两个zip的文件内容
* private check 检查zip文件是否正确
* private check_handler 检查server是否有安装unzip
*/ class ZipCompare{ // class start /** 比較zip文件内容,列出不同样的部分
* @param String $zipfile1 zip文件1
* @param String $zipfile2 zip文件2
* @return Array
*/
public function compare($zipfile1, $zipfile2){ // 检查是否有安装unzip
if(!$this->check_handler()){
throw new Exception('unzip not install');
} // 检查zip文件
if(!$this->check($zipfile1) || !$this->check($zipfile2)){
throw new Exception('zipfile not exists or error');
} // 获取zip内文件列表
$zipinfo1 = $this->getInfo($zipfile1);
$zipinfo2 = $this->getInfo($zipfile2); // 分析两个zip的文件内容,返回同样及不同的文件列表
return $this->parse($zipinfo1, $zipinfo2); } /** 获取zip内文件列表
* @param String $zipfile zip文件
* @return Array zip内文件列表
*/
private function getInfo($zipfile){ // unzip -v fields
$fields = array('Length','Method','Size','Cmpr','Date','Time','CRC-32','Name'); // zip verbose
$verbose = shell_exec(sprintf("unzip -v %s | sed '\$d' | sed '\$d' | sed -n '4,\$p'", $zipfile)); // zip info
$zipinfo = array(); $filelist = explode("\n", $verbose); if($filelist){
foreach($filelist as $rowdata){
if($rowdata==''){
continue;
}
$rowdata = preg_replace('/[ ]{2,}/', ' ', $rowdata); // 将两个或以上空格替换为一个
$tmp = array_slice(explode(' ', $rowdata), 1); // 去掉第一个空格 $file = array_combine($fields, $tmp); $zipinfo[$file['Name']] = $file['Length'].'_'.$file['CRC-32']; // 文件名称,长度,CRC32,用于校验
}
} return $zipinfo; } /** 分析两个zip文件内容
* @param String $zipinfo1
* @param String $zipinfo2
* @return Array
*/
private function parse($zipinfo1, $zipinfo2){ $result = array(
'add' => array(), // 新增
'del' => array(), // 缺少
'match' => array() // 匹配
); if($zipinfo1 && $zipinfo2){ // 在zip1但不在zip2的文件
$result['add'] = array_values(array_diff(array_keys($zipinfo1), array_keys($zipinfo2))); // 在zip2但不在zip1的文件
$result['del'] = array_values(array_diff(array_keys($zipinfo2), array_keys($zipinfo1))); // 同一时候在zip1与zip2的文件
$match_file = array_values(array_diff(array_keys($zipinfo1), $result['add'])); // 检查同样文件名称的文件内容是否匹配
for($i=0,$len=count($match_file); $i<$len; $i++){ if($zipinfo1[$match_file[$i]]==$zipinfo2[$match_file[$i]]){ // match
array_push($result['match'], $match_file[$i]);
}else{ // not match, change to add
array_push($result['add'], $match_file[$i]);
} } } return $result; } /** 检查zip文件是否正确
* @param String $zipfile zip文件
* @return boolean
*/
private function check($zipfile){
// 文件存在且能解压
return file_exists($zipfile) && shell_exec(sprintf('unzip -v %s | wc -l', $zipfile))>1;
} /** 检查server是否有安装unzip
* @return boolean
*/
private function check_handler(){
return strstr(shell_exec('unzip -v'), 'version')!='';
} } // class end ?>
demo
<?php require "ZipCompare.class.php"; $obj = new ZipCompare();
$result = $obj->compare('test1.zip','test2.zip'); print_r($result); ?>
运行后输出:
Array
(
[add] => Array
(
[0] => 9.jpg
) [del] => Array
(
[0] => 5.jpg
[1] => 6.jpg
[2] => 7.jpg
[3] => 8.jpg
) [match] => Array
(
[0] => 1.jpg
[1] => 10.jpg
[2] => 11.jpg
[3] => 12.jpg
[4] => 13.jpg
[5] => 14.jpg
[6] => 15.jpg
[7] => 16.jpg
[8] => 17.jpg
[9] => 18.jpg
[10] => 2.jpg
[11] => 3.jpg
[12] => 4.jpg
) )
源代码下载地址:点击查看
php zip文件内容比較类的更多相关文章
- 011PHP文件处理——文件处理 文件内容分页操作类
<?php /** * 文件内容分页操作类: */ //访问地址:http://basicphp.com/006file/011.php?&page=1 class StrPage { ...
- 解决gvim 8.1中zip插件打开zip文件内容时,而文件路径带有空格的问题。
解决gvim 8.1中zip插件打开zip文件内容时,而文件路径带有空格的问题. 现象是只能打开一次,第二次打开就显示为空了. 通过 lcd切换工作目录.使得命令行操作中不再有带空格的路径 vim81 ...
- 读取Zip文件内容
第一步,上次文件并保存到服务器目录下 /// <summary> /// 上传压缩文件 /// </summary> protected void UploadZip() { ...
- zip文件解压工具类
java解压zip文件 import java.io.BufferedInputStream; import java.io.BufferedOutputStream; import java.io. ...
- Web API 自定义文件内容的定制类
public class FileContent : HttpContent { private readonly Stream _stream; public FileContent(string ...
- Java文件编码自动转换工具类(只改变编码,不会改变文件内容)
本篇随笔主要介绍了一个用java语言写的将一个文件编码转换为另一个编码并不改变文件内容的工具类: 通过读取源文件内容,用URLEncoding重新编码解码的方式实现. public class Cha ...
- 工具类_JavaPOI_Office文件内容读取
文件内容读取工具类,亲测可用 maven依赖: <dependency> <groupId>org.apache.poi</groupId> <artifac ...
- 【.NET深呼吸】Zip文件操作(1):创建和读取zip文档
.net的IO操作支持对zip文件的创建.读写和更新.使用起来也比较简单,.net的一向作风,东西都准备好了,至于如何使用,请看着办. 要对zip文件进行操作,主要用到以下三个类: 1.ZipFile ...
- 8.5 filecmp--文件和文件夹比較处理
本模块主要提供了对文件和文件夹进行简单的比較处理,假设须要复杂的文件比較须要使用difflib库来处理. filecmp.cmp(f1, f2, shallow=True) 比較文件f1和文件f2,当 ...
随机推荐
- Linux实现字符设备驱动的基础步骤
Linux应用层想要操作kernel层的API,比方想操作相关GPIO或寄存器,能够通过写一个字符设备驱动来实现. 1.先在rootfs中的 /dev/ 下生成一个字符设备.注意主设备号 和 从设备号 ...
- hdu 1086(判断线段相交)
传送门:You can Solve a Geometry Problem too 题意:给n条线段,判断相交的点数. 分析:判断线段相交模板题,快速排斥实验原理就是每条线段代表的向量和该线段的一个端点 ...
- ajaxterm不好还是gateone好
http://pkgs.org/centos-5-rhel-5/epel-i386/Ajaxterm-0.10-8.el5.noarch.rpm.html Web SSH 客户端Ajaxterm安装 ...
- oracle乱码问题
oracle乱码问题通常是因为oracle字符集设置和操作系统字符集设置不一致造成的,这里不得不提到两个操作系统环境变量,LANG和NLS_LANG LANG是针对Linux系统的语言.地区.字符集的 ...
- js关闭浏览器窗口事件
js关闭浏览器窗口 js关闭浏览器窗口,不弹出提示框.支持ie6+,火狐,谷歌等浏览器. <html> <head /> <body> <script typ ...
- Java提供的enum详解
今天第一天看<<Effective Java>>,看了第六章的第一条就是全书的第30条--用enum代替int常量. 1.第一次知道原来enum也可以像class那样拥有成员函 ...
- PHP实现冒泡排序、双向冒泡排序算法
冒泡排序(Bubble Sort),是一种较简单的.稳定的排序算法.冒泡排序算法步骤:比较相邻的元素,如果第一个比第二个大,就交换他们两个的位置:对每对相邻的元素执行同样的操作,这样一趟下来,最后的元 ...
- mysql用户权限分配及主从同步复制
赋予wgdp用户查询权限: grant select on wg_dp.* to 'wgdp'@'%' IDENTIFIED BY 'weigou123'; grant all privileges ...
- Windows phone 8 学习笔记(5) 图块与通知
原文:Windows phone 8 学习笔记(5) 图块与通知 基于metro风格的Windows phone 8 应用提到了图块的概念,它就是指启动菜单中的快速启动图标.一般一个应用必须有一个默认 ...
- Solaris 10下使用Python3
通常在Solaris 10上仅仅能使用Python2.x. 假设使用Python3的话,一种就是http://www.sunfreeware.com获取可用的二进制版本号.只是眼下这个站点已经不提供免 ...