Zstandard 简称Zstd,是一款快速实时的开源数据压缩程序,由Facebook开发,源码是用C语言编写的。相比业内其他压缩算法(如Gzip、Snappy、Zlib)它的特点是:当需要时,它可以将压缩速度交换为更高的压缩比率(压缩速度与压缩比率的权衡可以通过小增量来配置),反之亦

Zstd-jni

Zstd拥有丰富的API,几乎支持所有流行的编程语言,Zstd-jni 是Java中提供的API然。 它具有小数据压缩的特殊模式,称为字典压缩,可以从任何提供的样本集中构建字典。

<dependency>

    <groupId>com.github.luben</groupId>

    <artifactId>zstd-jni</artifactId>

    <version>VERSION</version>

</dependency>

  1.  
    /*
  2.  
    序列化
  3.  
    */
  4.  
    public static <T> byte[] serialize(T result) throws IOException {
  5.  
    ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream(512);
  6.  
    try (OutputStream outputStream = new ZstdOutputStream(byteArrayOutputStream)) {
  7.  
    // protostuff serialize
  8.  
    ProtostuffSerializer.serialize(result, outputStream);
  9.  
    return byteArrayOutputStream.toByteArray();
  10.  
    }
  11.  
    }
  12.  
     
  13.  
    /*
  14.  
    反序列化
  15.  
    */
  16.  
    public static <T> T deserialize(byte[] bytes, Class<T> clazz) throws IOException {
  17.  
    ByteArrayInputStream byteArrayInputStream = new ByteArrayInputStream(bytes);
  18.  
    try (InputStream inputStream = new ZstdInputStream(byteArrayInputStream)) {
  19.  
    // protostuff deserialize
  20.  
    return ProtostuffSerializer.deserialize(clazz, inputStream);
  21.  
    }
  22.  
    }
  1.  
    ZstdDictTrainer zstdDictTrainer = new ZstdDictTrainer(1024 * 1024, 32 * 1024);
  2.  
    // fileInput is a sample file
  3.  
    zstdDictTrainer.addSample(fileInput);
  4.  
    byte[] dic = zstdDictTrainer.trainSamples(true);
  5.  
     
  6.  
    /*
  7.  
    Zstd's training model
  8.  
    */
  9.  
    public static <T> byte[] serialize(T result) throws IOException {
  10.  
    ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream(512);
  11.  
    try (ZstdOutputStream outputStream = new ZstdOutputStream(byteArrayOutputStream)) {
  12.  
    if (dic != null) {
  13.  
    outputStream.setDict(dic);
  14.  
    }
  15.  
    // protostuff serialize
  16.  
    ProtostuffSerializer.serialize(result, outputStream);
  17.  
    return byteArrayOutputStream.toByteArray();
  18.  
    }
  19.  
    }
  20.  
     
  21.  
    /*
  22.  
    Zstd's training model
  23.  
    */
  24.  
    public static <T> T deserialize(byte[] bytes, Class<T> clazz) throws IOException {
  25.  
    ByteArrayInputStream byteArrayInputStream = new ByteArrayInputStream(bytes);
  26.  
    try (ZstdInputStream inputStream = new ZstdInputStream(byteArrayInputStream)) {
  27.  
    if (dic != null) {
  28.  
    inputStream.setDict(dic);
  29.  
    }
  30.  
    // protostuff deserialize
  31.  
    return ProtostuffSerializer.deserialize(clazz, inputStream);
  32.  
    }
  33.  
    }

服务器:VM/4CPU i5-6500/CentOS 6

exp1: 4KB

version

compress

decompress

Ratio

Gzip jdk1.8 0.162ms 0.059ms 2.31
Snappy 1.1.7.2 0.005ms 0.002ms 1.83
Zstd 1.3.7-3 0.033ms 0.012ms 2.27
Zstd_Dic 1.3.7-3 0.020ms 0.029ms 3.81

exp2: 16KB

version

compress

decompress

Ratio

Gzip jdk1.8 0.279ms 0.126ms 4.29
Snappy 1.1.7.2 0.022ms 0.007ms 3.18
Zstd 1.3.7-3 0.049ms 0.002ms 4.39
Zstd_Dic 1.3.7-3 0.062ms 0.017ms 5.70

exp3: 43KB

version

compress

decompress

Ratio

Gzip jdk1.8 0.767ms 0.339ms 6.49
Snappy 1.1.7.2 0.111ms 0.044ms 4.36
Zstd 1.3.7-3 0.257ms 0.018ms 6.67
Zstd_Dic 1.3.7-3 0.199ms 0.061ms 8.12

exp4: 134KB

version

compress

decompress

Ratio

Gzip jdk1.8 1.786ms 1.026ms 13.34
Snappy 1.1.7.2 0.894ms 0.595ms 6.53
Zstd 1.3.7-3 0.411ms 0.198ms 14.74
Zstd_Dic 1.3.7-3 0.220ms 0.089ms 16.48

exp5:  654KB

version

compress

decompress

Ratio

Gzip jdk1.8 4.587ms 1.865ms 33.64
Snappy 1.1.7.2 2.069ms 1.430ms 8.86
Zstd 1.3.7-3 2.864ms 0.116ms 45.57
Zstd_Dic 1.3.7-3 0.426ms 0.218ms 47.38

引用链接:

https://github.com/facebook/zstd

https://github.com/luben/zstd-jni

Zstd-数据压缩组件的更多相关文章

  1. 【转载】.NET压缩/解压文件/夹组件

    转自:http://www.cnblogs.com/asxinyu/archive/2013/03/05/2943696.html 阅读目录 1.前言 2.关于压缩格式和算法的基础 3.几种常见的.N ...

  2. C# 压缩组件介绍与入门

    1.前言 作为吉日嘎拉权限管理系统最早的一批学习版用户,学了不少东西,在群里面也结识了很多朋友,更重要的是闲余时间,大家都发布很多可靠的外包工作.这次也是由于吉日嘎拉发布了一个有关“压缩文件损坏检测” ...

  3. C#编程总结(十三)数据压缩

    C#编程总结(十三)数据压缩 在进行文件存储或者数据传输时,为了节省空间流量,需要对数据或文件进行压缩.在这里我们讲述通过C#实现数据压缩. 一.GZipStream压缩 微软提供用于压缩和解压缩流的 ...

  4. Web前端性能优化教程04:压缩组件

    本文是Web前端性能优化系列文章中的第四篇,主要讲述内容:压缩组件.完整教程可查看:Web前端性能优化 基础知识 gzip编码:gzip是GUNzip的缩写,是使用无损压缩算法的一种,最早是用于Uni ...

  5. 支付宝 Android 版使用的开源组件

    支付宝 Android 版使用的开源组件 前言: 花了点时间整理了 支付宝 Android 客户端使用的开源组件,给需要的同学.在你不知道用什么开源框架的时候可以作下参考,毕竟支付宝是阿里的重量级产品 ...

  6. zstd --压缩工具

    Zstandard (也被称为zstd )是一款免费的开源,快速实时数据压缩程序,具有更好的压缩比 (约为 10:1). 安装 yum group install "Development ...

  7. openstack项目【day23】:keystone组件HTTP协议

    阅读目录 一 为何要学习HTTP协议 二 用户上网过程 三 HTTP协议 part1 http协议概述 part2 请求协议 part3 响应协议 四 抓包分析HTTP协议 一 为何要学习HTTP协议 ...

  8. HBase 架构与工作原理2 - HBase 组件

    本文系转载,如有侵权,请联系我:likui0913@gmail.com 一.HBase 组件概览 Master-Slave 模式: HBase 体系结构遵循传统的 master-slave 模式,由一 ...

  9. Hadoop Hive概念学习系列之hive的数据压缩(七)

    Hive文件存储格式包括以下几类: 1.TEXTFILE 2.SEQUENCEFILE 3.RCFILE 4.ORCFILE 其中TEXTFILE为默认格式,建表时不指定默认为这个格式,导入数据时会直 ...

  10. RT_THREAD之组件学习

    CmBacktrace (Cortex Microcontroller Backtrace)是一款针对 ARM Cortex-M 系列 MCU 的错误代码自动追踪.定位,错误原因自动分析的开源库.支持 ...

随机推荐

  1. vue3中的vue-18n的table表格标题不动态变化中英文

    使用 computed 即可 eg: const columns = computed(() => { return reactive<any>([ { title: proxy.$ ...

  2. 你对 Vue.js 的template 编译的理解?

    template 是 ES5 新出的语法 ,template 是不会被页面显示的,但是 vue 中会被翻译成 dom 结构 : template 编译的过程 : parse 解析生成ast 抽象语法树 ...

  3. KubeSphere 社区双周报 | Java functions framework 支持 SkyWalking | 2023.8.4-8.17

    KubeSphere 社区双周报主要整理展示新增的贡献者名单和证书.新增的讲师证书以及两周内提交过 commit 的贡献者,并对近期重要的 PR 进行解析,同时还包含了线上/线下活动和布道推广等一系列 ...

  4. RocketMQ 在小米的多场景灾备实践案例

    本文作者:邓志文.王帆 01为什么要容灾? 在小米内部,我们使用 RocketMQ 来为各种在线业务提供消息队列服务,比如商城订单.短信通知甚至用来收集 IoT 设备的上报数据,可以说 RocketM ...

  5. LaMI-DETR:基于GPT丰富优化的开放词汇目标检测 | ECCV'24

    现有的方法通过利用视觉-语言模型(VLMs)(如CLIP)强大的开放词汇识别能力来增强开放词汇目标检测,然而出现了两个主要挑战:(1)概念表示不足,CLIP文本空间中的类别名称缺乏文本和视觉知识.(2 ...

  6. 云电脑玩游戏挑选标准,ToDesk实测体验

    大家玩游戏还在攒机吗?与其花费时间精力在组装游戏电脑上,不如用上最近兴起的云电脑软件.无需额外配备硬件设备,旧电脑原地变身成高性能电脑,随时随地享受游戏乐趣. 但市面上众多的云电脑软件,该怎么选择才能 ...

  7. Machine Learning Week_1 Introduction 5-8

    目录 1.5 Vedio: Supervised Learning unfamiliar words 1.6 Reading: Supervised Learning unfamiliar words ...

  8. QT生成固定长度的随机字符串

    最近项目中有一个需要使用QT生成固定长度随机字符串的需求,需求也很简单,就是生成一个n位的仅包含0-9以及大写字母的字符串,因为这也是第一次使用QT自身的随机数,这里就做一下简单记录. 废话不多说,直 ...

  9. Python字典推导式

    要求打印字典中值小于1的key和value d = {"a": 1, "b":2, "c":3} d = {key: value for k ...

  10. Nuxt.js 应用中的 vite:serverCreated 事件钩子

    title: Nuxt.js 应用中的 vite:serverCreated 事件钩子 date: 2024/11/18 updated: 2024/11/18 author: cmdragon ex ...