Zstandard 简称Zstd,是一款快速实时的开源数据压缩程序,由Facebook开发,源码是用C语言编写的。相比业内其他压缩算法(如Gzip、Snappy、Zlib)它的特点是:当需要时,它可以将压缩速度交换为更高的压缩比率(压缩速度与压缩比率的权衡可以通过小增量来配置),反之亦

Zstd-jni

Zstd拥有丰富的API,几乎支持所有流行的编程语言,Zstd-jni 是Java中提供的API然。 它具有小数据压缩的特殊模式,称为字典压缩,可以从任何提供的样本集中构建字典。

<dependency>

    <groupId>com.github.luben</groupId>

    <artifactId>zstd-jni</artifactId>

    <version>VERSION</version>

</dependency>

  1.  
    /*
  2.  
    序列化
  3.  
    */
  4.  
    public static <T> byte[] serialize(T result) throws IOException {
  5.  
    ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream(512);
  6.  
    try (OutputStream outputStream = new ZstdOutputStream(byteArrayOutputStream)) {
  7.  
    // protostuff serialize
  8.  
    ProtostuffSerializer.serialize(result, outputStream);
  9.  
    return byteArrayOutputStream.toByteArray();
  10.  
    }
  11.  
    }
  12.  
     
  13.  
    /*
  14.  
    反序列化
  15.  
    */
  16.  
    public static <T> T deserialize(byte[] bytes, Class<T> clazz) throws IOException {
  17.  
    ByteArrayInputStream byteArrayInputStream = new ByteArrayInputStream(bytes);
  18.  
    try (InputStream inputStream = new ZstdInputStream(byteArrayInputStream)) {
  19.  
    // protostuff deserialize
  20.  
    return ProtostuffSerializer.deserialize(clazz, inputStream);
  21.  
    }
  22.  
    }
  1.  
    ZstdDictTrainer zstdDictTrainer = new ZstdDictTrainer(1024 * 1024, 32 * 1024);
  2.  
    // fileInput is a sample file
  3.  
    zstdDictTrainer.addSample(fileInput);
  4.  
    byte[] dic = zstdDictTrainer.trainSamples(true);
  5.  
     
  6.  
    /*
  7.  
    Zstd's training model
  8.  
    */
  9.  
    public static <T> byte[] serialize(T result) throws IOException {
  10.  
    ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream(512);
  11.  
    try (ZstdOutputStream outputStream = new ZstdOutputStream(byteArrayOutputStream)) {
  12.  
    if (dic != null) {
  13.  
    outputStream.setDict(dic);
  14.  
    }
  15.  
    // protostuff serialize
  16.  
    ProtostuffSerializer.serialize(result, outputStream);
  17.  
    return byteArrayOutputStream.toByteArray();
  18.  
    }
  19.  
    }
  20.  
     
  21.  
    /*
  22.  
    Zstd's training model
  23.  
    */
  24.  
    public static <T> T deserialize(byte[] bytes, Class<T> clazz) throws IOException {
  25.  
    ByteArrayInputStream byteArrayInputStream = new ByteArrayInputStream(bytes);
  26.  
    try (ZstdInputStream inputStream = new ZstdInputStream(byteArrayInputStream)) {
  27.  
    if (dic != null) {
  28.  
    inputStream.setDict(dic);
  29.  
    }
  30.  
    // protostuff deserialize
  31.  
    return ProtostuffSerializer.deserialize(clazz, inputStream);
  32.  
    }
  33.  
    }

服务器:VM/4CPU i5-6500/CentOS 6

exp1: 4KB

version

compress

decompress

Ratio

Gzip jdk1.8 0.162ms 0.059ms 2.31
Snappy 1.1.7.2 0.005ms 0.002ms 1.83
Zstd 1.3.7-3 0.033ms 0.012ms 2.27
Zstd_Dic 1.3.7-3 0.020ms 0.029ms 3.81

exp2: 16KB

version

compress

decompress

Ratio

Gzip jdk1.8 0.279ms 0.126ms 4.29
Snappy 1.1.7.2 0.022ms 0.007ms 3.18
Zstd 1.3.7-3 0.049ms 0.002ms 4.39
Zstd_Dic 1.3.7-3 0.062ms 0.017ms 5.70

exp3: 43KB

version

compress

decompress

Ratio

Gzip jdk1.8 0.767ms 0.339ms 6.49
Snappy 1.1.7.2 0.111ms 0.044ms 4.36
Zstd 1.3.7-3 0.257ms 0.018ms 6.67
Zstd_Dic 1.3.7-3 0.199ms 0.061ms 8.12

exp4: 134KB

version

compress

decompress

Ratio

Gzip jdk1.8 1.786ms 1.026ms 13.34
Snappy 1.1.7.2 0.894ms 0.595ms 6.53
Zstd 1.3.7-3 0.411ms 0.198ms 14.74
Zstd_Dic 1.3.7-3 0.220ms 0.089ms 16.48

exp5:  654KB

version

compress

decompress

Ratio

Gzip jdk1.8 4.587ms 1.865ms 33.64
Snappy 1.1.7.2 2.069ms 1.430ms 8.86
Zstd 1.3.7-3 2.864ms 0.116ms 45.57
Zstd_Dic 1.3.7-3 0.426ms 0.218ms 47.38

引用链接:

https://github.com/facebook/zstd

https://github.com/luben/zstd-jni

Zstd-数据压缩组件的更多相关文章

  1. 【转载】.NET压缩/解压文件/夹组件

    转自:http://www.cnblogs.com/asxinyu/archive/2013/03/05/2943696.html 阅读目录 1.前言 2.关于压缩格式和算法的基础 3.几种常见的.N ...

  2. C# 压缩组件介绍与入门

    1.前言 作为吉日嘎拉权限管理系统最早的一批学习版用户,学了不少东西,在群里面也结识了很多朋友,更重要的是闲余时间,大家都发布很多可靠的外包工作.这次也是由于吉日嘎拉发布了一个有关“压缩文件损坏检测” ...

  3. C#编程总结(十三)数据压缩

    C#编程总结(十三)数据压缩 在进行文件存储或者数据传输时,为了节省空间流量,需要对数据或文件进行压缩.在这里我们讲述通过C#实现数据压缩. 一.GZipStream压缩 微软提供用于压缩和解压缩流的 ...

  4. Web前端性能优化教程04:压缩组件

    本文是Web前端性能优化系列文章中的第四篇,主要讲述内容:压缩组件.完整教程可查看:Web前端性能优化 基础知识 gzip编码:gzip是GUNzip的缩写,是使用无损压缩算法的一种,最早是用于Uni ...

  5. 支付宝 Android 版使用的开源组件

    支付宝 Android 版使用的开源组件 前言: 花了点时间整理了 支付宝 Android 客户端使用的开源组件,给需要的同学.在你不知道用什么开源框架的时候可以作下参考,毕竟支付宝是阿里的重量级产品 ...

  6. zstd --压缩工具

    Zstandard (也被称为zstd )是一款免费的开源,快速实时数据压缩程序,具有更好的压缩比 (约为 10:1). 安装 yum group install "Development ...

  7. openstack项目【day23】:keystone组件HTTP协议

    阅读目录 一 为何要学习HTTP协议 二 用户上网过程 三 HTTP协议 part1 http协议概述 part2 请求协议 part3 响应协议 四 抓包分析HTTP协议 一 为何要学习HTTP协议 ...

  8. HBase 架构与工作原理2 - HBase 组件

    本文系转载,如有侵权,请联系我:likui0913@gmail.com 一.HBase 组件概览 Master-Slave 模式: HBase 体系结构遵循传统的 master-slave 模式,由一 ...

  9. Hadoop Hive概念学习系列之hive的数据压缩(七)

    Hive文件存储格式包括以下几类: 1.TEXTFILE 2.SEQUENCEFILE 3.RCFILE 4.ORCFILE 其中TEXTFILE为默认格式,建表时不指定默认为这个格式,导入数据时会直 ...

  10. RT_THREAD之组件学习

    CmBacktrace (Cortex Microcontroller Backtrace)是一款针对 ARM Cortex-M 系列 MCU 的错误代码自动追踪.定位,错误原因自动分析的开源库.支持 ...

随机推荐

  1. element的图片上传预处理函数

    /** 图片格式和大小的控制 */ beforeAvatarUpload (file) { // 允许上传 jpg 和 png 格式的图片 const isJPG = file.type === &q ...

  2. 使用zipkin配置spring boot的链路器(httpclient、restTemplate)

    一.首先导入zipkin需要的依赖 <!--zipkin-brave start--> <dependency> <groupId>io.zipkin.brave& ...

  3. 从围绕API到围绕数据-使用流式编程构建更简洁的架构

    背景 在服务刚刚搭建时,通常的思维就是根据API编写业务逻辑: // SendStream ... func (d *Svc) SendStream(stream MyApi_data.ProxyDi ...

  4. PHP伪协议(PHP://、Pseudo-Protocols)和其他常用协议

    介绍 在PHP中,"伪协议" 是一种特殊的协议,它并不涉及传统的网络传输,而是用于访问特定的PHP功能或资源.这些伪协议通常以 php:// 开头,并用于操作数据流.内存.进程的输 ...

  5. gcc各等级优化的性质

    原帖地址:CSDN「隨意的風」gcc 中-O -O1 -O2 -O3 -Os -Ofast -Og优化的原理 一般来说,如果不指定优化标识的话,gcc就会产生可调试代码,每条指令之间将是独立的:可以在 ...

  6. Shell简单入门程序参考

    目录 0 前言 0.1 shell初试 1 程序功能 1.1 显示当前主机名和IP地址. 1.1.1 if 语句 详解 1.2 创建目录或者文件 1.3 修改文件属性 1.3.1 chmod 修改文件 ...

  7. 使用netsh命令行进行网络管理

    显示网络适配器状态 netsh interface show interface 显示各个网络适配器的名称和状态 启用(禁用)网络适配器 本系列命令需要以"以管理员身份运行". 禁 ...

  8. 3.4 Linux文件(目录)命名规则

    介绍完 Linux 系统中目录结构之后,读者一定想知道如何为文件或目录命名. 我们知道,在 Linux 系统中,一切都是文件,既然是文件,就必须要有文件名.同其他系统相比,Linux 操作系统对文件或 ...

  9. 别再手动处理数据了!FastGPT 这个新功能让你提前下班

    大家好!今天给大家介绍 FastGPT 4.8.11 版本新增的一个超强节点 - [循环运行]节点.如果你经常需要处理大量数据,这个功能绝对能让你事半功功倍! 这个节点是干嘛的? 想象一下这个场景:你 ...

  10. Mysql数据库笔记整理

    数据库-理论基础 1.什么是数据库? 数据:描述事物的符号记录,可以是数字.文字.图形.图像.声音.语言等,数据有多种形式,它们都可以经过数字化后存入计算机. 数据库:存储数据的仓库,是长期存放在计算 ...