本文介绍Java压缩/解压.zip、.tar.gz、.tar.bz2的方式。

  1. 对于zip文件:使用java.util.zip.ZipEntryjava.util.zip.ZipFile,通过设置CharsetStandardCharsets.UTF_8支持中文。
  2. 对于.tar.gz、tgz文件:可以看做先用tar打包,再使用gz进行压缩。使用commons-compress包的TarArchiveInputStreamGzipCompressorInputStream
  3. 对于.tar.bz2文件:可以看做先用tar打包,再使用bz2进行压缩。使用commons-compress包的TarArchiveInputStreamBZip2CompressorInputStream

在这里有个问题如果使用TarInputStream搭配jdk的 GZIPInputStream会产生乱码。而使用commons-compress包的TarArchiveInputStreamGzipCompressorInputStream则可解决乱码问题。

代码如下:

public class ZipUtil {

    private static final Logger LOG = LoggerFactory.getLogger(ZipUtil.class);

    private static final int BUFFER_SIZE = 1024 * 100;

    private ZipUtil() {
} /**
* 私有函数将文件集合压缩成tar包后返回
*
* @param files 要压缩的文件集合
* @param target tar 输出流的目标文件
* @return File 指定返回的目标文件
*/
private static File pack(List<File> files, File target) throws IOException{
try (FileOutputStream fos = new FileOutputStream(target)) {
try (BufferedOutputStream bos = new BufferedOutputStream(fos, BUFFER_SIZE)) {
try (TarArchiveOutputStream taos = new TarArchiveOutputStream(bos)) {
//解决文件名过长问题
taos.setLongFileMode(TarArchiveOutputStream.LONGFILE_GNU);
for (File file : files) {
taos.putArchiveEntry(new TarArchiveEntry(file));
try (FileInputStream fis = new FileInputStream(file)) {
IOUtils.copy(fis, taos);
taos.closeArchiveEntry();
}
}
}
}
}
return target;
} /**
* 将tar压缩成tar.gz文件
*
* @param list
* @param outPutPath
* @param fileName
*/
public static File compress(List<File> list, String outPutPath, String fileName) throws IOException {
File outPutFile = new File(outPutPath + File.separator + fileName + ".tar.gz");
File tempTar = new File("temp.tar");
try (FileInputStream fis = new FileInputStream(pack(list, tempTar))) {
try (BufferedInputStream bis = new BufferedInputStream(fis, BUFFER_SIZE)) {
try (FileOutputStream fos = new FileOutputStream(outPutFile)) {
try (GZIPOutputStream gzp = new GZIPOutputStream(fos)) {
int count;
byte[] data = new byte[BUFFER_SIZE];
while ((count = bis.read(data, 0, BUFFER_SIZE)) != -1) {
gzp.write(data, 0, count);
}
}
}
}
}
try {
Files.deleteIfExists(tempTar.toPath());
} catch (IOException e) {
e.printStackTrace();
}
return outPutFile;
} public static boolean decompress(String filePath, String outputDir, boolean isDeleted) {
File file = new File(filePath);
if (!file.exists()) {
LOG.error("decompress file not exist.");
return false;
}
try {
if (filePath.endsWith(".zip")) {
unZip(file, outputDir);
}
if (filePath.endsWith(".tar.gz") || filePath.endsWith(".tgz")) {
decompressTarGz(file, outputDir);
}
if (filePath.endsWith(".tar.bz2")) {
decompressTarBz2(file, outputDir);
}
filterFile(new File(outputDir));
if (isDeleted) {
FileUtils.deleteQuietly(file);
}
return true;
} catch (IOException e) {
LOG.error("decompress occur error.");
}
return false;
} /**
* 解压 .zip 文件
*
* @param file 要解压的zip文件对象
* @param outputDir 要解压到某个指定的目录下
* @throws IOException
*/
public static void unZip(File file, String outputDir) throws IOException {
try (ZipFile zipFile = new ZipFile(file, StandardCharsets.UTF_8)) {
//创建输出目录
createDirectory(outputDir, null);
Enumeration<?> enums = zipFile.entries();
while (enums.hasMoreElements()) {
ZipEntry entry = (ZipEntry) enums.nextElement();
if (entry.isDirectory()) {
//创建空目录
createDirectory(outputDir, entry.getName());
} else {
try (InputStream in = zipFile.getInputStream(entry)) {
try (OutputStream out = new FileOutputStream(
new File(outputDir + File.separator + entry.getName()))) {
writeFile(in, out);
}
}
}
}
}
} public static void decompressTarGz(File file, String outputDir) throws IOException {
try (TarArchiveInputStream tarIn = new TarArchiveInputStream(
new GzipCompressorInputStream(
new BufferedInputStream(
new FileInputStream(file))))) {
//创建输出目录
createDirectory(outputDir, null);
TarArchiveEntry entry = null;
while ((entry = tarIn.getNextTarEntry()) != null) {
//是目录
if (entry.isDirectory()) {
//创建空目录
createDirectory(outputDir, entry.getName());
} else {
//是文件
try (OutputStream out = new FileOutputStream(
new File(outputDir + File.separator + entry.getName()))) {
writeFile(tarIn, out);
}
}
}
} } /**
* 解压缩tar.bz2文件
*
* @param file 压缩包文件
* @param outputDir 目标文件夹
*/
public static void decompressTarBz2(File file, String outputDir) throws IOException {
try (TarArchiveInputStream tarIn =
new TarArchiveInputStream(
new BZip2CompressorInputStream(
new FileInputStream(file)))) {
createDirectory(outputDir, null);
TarArchiveEntry entry;
while ((entry = tarIn.getNextTarEntry()) != null) {
if (entry.isDirectory()) {
createDirectory(outputDir, entry.getName());
} else {
try (OutputStream out = new FileOutputStream(
new File(outputDir + File.separator + entry.getName()))) {
writeFile(tarIn, out);
}
}
}
}
} /**
* 写文件
*
* @param in
* @param out
* @throws IOException
*/
public static void writeFile(InputStream in, OutputStream out) throws IOException {
int length;
byte[] b = new byte[BUFFER_SIZE];
while ((length = in.read(b)) != -1) {
out.write(b, 0, length);
}
} /**
* 创建目录
*
* @param outputDir
* @param subDir
*/
public static void createDirectory(String outputDir, String subDir) {
File file = new File(outputDir);
//子目录不为空
if (!(subDir == null || subDir.trim().equals(""))) {
file = new File(outputDir + File.separator + subDir);
}
if (!file.exists()) {
if (!file.getParentFile().exists()) {
file.getParentFile().mkdirs();
}
file.mkdirs();
}
} /**
* 删除Mac压缩再解压产生的 __MACOSX 文件夹和 .开头的其他文件
*
* @param filteredFile
*/
public static void filterFile(File filteredFile) {
if (filteredFile != null) {
File[] files = filteredFile.listFiles();
for (File file : files) {
if (file.getName().startsWith(".") ||
(file.isDirectory() && file.getName().equals("__MACOSX"))) {
FileUtils.deleteQuietly(file);
}
}
}
}
}

代码地址: https://github.com/morethink/code/blob/master/java/tools/src/main/java/cn/morethink/tools/util/ZipUtil.java

参考文档

  1. commons-compress官方实例

Java压缩/解压.zip、.tar.gz、.tar.bz2(支持中文)的更多相关文章

  1. 原生java 压缩解压zip文件

    import java.io.BufferedInputStream; import java.io.BufferedOutputStream; import java.io.File; import ...

  2. JAVA压缩解压ZIP文件,中文乱码还需要ANT.JAR包

    package zip; import java.io.BufferedOutputStream; import java.io.File; import java.io.FileInputStrea ...

  3. (转载)C#压缩解压zip 文件

    转载之: C#压缩解压zip 文件 - 大气象 - 博客园http://www.cnblogs.com/greatverve/archive/2011/12/27/csharp-zip.html C# ...

  4. linux笔记:压缩解压命令gzip,gunzip,tar,zip,unzip,bzip2,bunzip2

    命令名称:gzip功能:压缩文件命令所在路径:/bin/gzip用法:gzip 文件压缩后文件格式:.gz其他:压缩后不保留原文件:只能压缩文件,不能压缩目录 命令名称:gunzip功能:解压.gz格 ...

  5. linux解压zip、bz、bz2、z、gz、tar(解包)

    zip: 压缩: zip [-AcdDfFghjJKlLmoqrSTuvVwXyz$][-b <工作目录>][-ll][-n <字尾字符串>][-t <日期时间>] ...

  6. java 压缩和解压zip包

    网上有关压缩和解压zip包的博文一大堆,我随便找了一个.看了看,依照自己的须要改动了一下,与各位分享一下,希望各位大神指正: package com.wangpeng.utill; import ja ...

  7. java实现解压zip文件,(亲测可用)!!!!!!

    项目结构: Util.java内容: package com.cfets.demo; import java.io.File; import java.io.FileOutputStream; imp ...

  8. C#压缩解压zip 文件

    /// <summary> /// Zip 压缩文件 /// </summary> public class Zip { public Zip() { } #region 加压 ...

  9. 压缩/解压 zip 时遇到 java.lang.IllegalArgumentException: MALFORMED

    因为zip文件名为中文,或者压缩内容有中文 解决方法: 错误详情: SLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinde ...

随机推荐

  1. YFCC 100M数据集分析笔记

    --从YFCC 100M数据集中筛选出Geo信息位于中国的数据集 1.YFCC 100M简介 YFCC 100M数据库是2014年来基于雅虎Flickr的影像数据库.该库由1亿条产生于2004年至20 ...

  2. nginx配置hls

    备注:本来是想用浏览器播放hls,后来没有成功,最后使用flash播放rtmp的方案.所以下面的配置未使用. 修改/usr/local/nginx/conf/nginx.conf文件内容如下: wor ...

  3. 转 彻底理解js中的&&和||

    javascript中,&&和||的用法比较神奇,经常用在对象上,例如a || b,如果a不存在,则返回b.a && b,如果a存在,则返回b,否则返回a. 光这样看, ...

  4. 第一个spring冲刺心得及感想

    在这次spring中,学到了不少东西: 1.团队协作精神 2.任务细节化,任务燃尽图 3.身为sm的责任 但是在过程中也认识到了一些不足 1.对于团队协作完成一个大的项目还是不熟悉 2.个人能力的不足 ...

  5. Scrum Meeting Beta - 6

    Scrum Meeting Beta - 6 NewTeam 2017/12/5 地点:主南201 任务反馈 团队成员 完成任务 计划任务 安万贺 完成了离线状态本地存储的读取Issue #133Pu ...

  6. charles使用教程 干货~

    大部分内容来自前辈们的摘写,博客园是怎么去转载其他好的博呢~ 言归正传,教程看过后还是自己再来一遍理解和操作才会更加深刻. Charles 是在 Mac/WIN下常用的网络封包截取工具,在做移动开发时 ...

  7. PAT 1147 Heaps

    https://pintia.cn/problem-sets/994805342720868352/problems/994805342821531648 In computer science, a ...

  8. 命令行方式操作O365

    这几天公司为O365启用了双因子认证,期间出了些小问题,导致我无法使用管理员账号登入控制台,但是Powershell的方法依旧可以.所以我觉得还是有必要把图形化操作改成脚本操作,以备不时之需.以后凡是 ...

  9. Python中pip install MySQL-python报错解决方法

    环境 Centos 7(其他Centos或者RHEL一样) 问题 在执行 pip install MySQL-python 时报错如: Command "python setup.py eg ...

  10. 二叉树 Java 实现 前序遍历 中序遍历 后序遍历 层级遍历 获取叶节点 宽度 ,高度,队列实现二叉树遍历 求二叉树的最大距离

    数据结构中一直对二叉树不是很了解,今天趁着这个时间整理一下 许多实际问题抽象出来的数据结构往往是二叉树的形式,即使是一般的树也能简单地转换为二叉树,而且二叉树的存储结构及其算法都较为简单,因此二叉树显 ...