赫夫曼解码(day17)

思路：

传入map（字节与对应字节出现的次数）和最后生成的要传送的字节。
将他们先转换成对应的二进制字节，再转换成原来的字符串。

代码：

public class HuffumanTreeCode {
    public static void main(String[] args) {
        String content = " i like like like java do you like a java"; //待转化的字符串
        byte[] contentbytes=content.getBytes();  //得到字符串对应的字节数组
        System.out.println(Arrays.toString(huffumanzip(contentbytes)));

        byte[] sourceBytes = decode(stringMap, huffumanzip(contentbytes));
        System.out.println("原来的字符串="+ new String(sourceBytes));

    }
    public static void preOrder(Node node){
        if (node!=null){
            node.pre();
        }else {
            System.out.println("赫夫曼树为空！");
        }
    }
    public static byte[] huffumanzip(byte[] bytes){
        List<Node> list=getNodes(bytes);  //把byte转化成list存储
        Node node=createHuffmanTree(list);  //构建哈夫曼树
        Map<Byte,String> map=getCodes(node);//对应的赫夫曼编码(根据赫夫曼树)
        byte[] bytes1=finallyCode(bytes,map);  //压缩编码
        return bytes1;
    }
    //得到字符串对应的list
    public static List<Node> getNodes(byte[] bytes){
        //创建一个ArrayList
        List<Node> list=new ArrayList<>();
        //遍历bytes;统计每一个byte出现的次数->map[key ,value]
        Map<Byte,Integer> map=new HashMap<>();
        for (Byte b:bytes){
            Integer conut=map.get(b);
            if (conut==null){   // Map还没有这个字符数据，第一次
                map.put(b,1);
            }else {
                map.put(b,conut+1);
            }
        }
        //把每一个键值对转成-个Node对象，并加入到nodes集合
       //遍历map
        for (Map.Entry<Byte,Integer> map1:map.entrySet()){
            list.add(new Node(map1.getKey(),map1.getValue()));
        }

        return list;

    }
    //最终发送的赫夫曼编码(最终要发送的字节数组)
    public static byte[] finallyCode(byte[] bytes,Map<Byte,String> map){
        int len;
        int index=0;
        String str;
        StringBuffer stringBuffer=new StringBuffer();
        for (byte b:bytes){大专栏  赫夫曼解码(day17)n>
            stringBuffer.append(map.get(b));
        }
//        System.out.println("ffffffff"+stringBuffer.toString());
       //将哈夫曼编码按照8个为一组进行合并，达到压缩的目的
        if (stringBuffer.length()%8==0){   //计算新的数组的大小
            len=stringBuffer.length()/8;
        }else {
            len=stringBuffer.length()/8+1;
        }
        byte[] bytes1=new byte[len];
        for (int i=0;i<stringBuffer.length();i+=8){
            if (i+8>stringBuffer.length()){
                 str=stringBuffer.substring(i);
            }else {
                str=stringBuffer.substring(i,i+8);
            }
            bytes1[index]=(byte) Integer.parseInt(str,2);
            index++;
        }
        return bytes1;
    }

    //可以通过List创建对应的赫夫曼树
    public static Node createHuffmanTree(List<Node> nodes){
        while (nodes.size()>1){
            Collections.sort(nodes);  //排序，从小到大
            Node leftNode=nodes.get(0);
            Node rightNode=nodes.get(1);
            //创建一颗新的二叉树，它的根节点没有data,只有权值
            Node parent=new Node(null,leftNode.weight+rightNode.weight);
            parent.left=leftNode;
            parent.right=rightNode;
            nodes.remove(leftNode);
            nodes.remove(rightNode);
            nodes.add(parent);
        }
        return nodes.get(0);  //nodes最后的结点，就是赫夫曼树的根结点
    }

    public static Map<Byte,String> getCodes(Node node){
        if (node==null){
            System.out.println("传的为空值！");
        }else {
             getCodes(node,"",stringBuffer);
        }
        return stringMap;
    }

    //生成赫夫曼树对应的赫夫曼编码
   //思路:
   //1.将赫夫曼编码表存放在Map<Byte ,String>形式
  //32->01 97->100 100->11000等等[形式]
    static Map<Byte,String> stringMap=new HashMap<>();
    //创建StringBuffer对象，用于字符串的拼接
    static StringBuffer stringBuffer=new StringBuffer();
//    @param node传入结点
//    @param code路径: 左子结点是0,右子结点1
//    @param stringBuilder 用于拼接路径
    public static void getCodes(Node node,String code,StringBuffer stringBuffer){
         StringBuffer stringBuffer1=new StringBuffer(stringBuffer);
         stringBuffer1.append(code);
         if (node!=null){
             //判断当前node是叶子结点还是非叶子结点
             if (node.data==null){
                 getCodes(node.left,"0",stringBuffer1);  //向左递归
                 getCodes(node.right,"1",stringBuffer1);  //向右递归
             }else {  //说明是一个叶子结点
                  stringMap.put(node.data,stringBuffer1.toString());
             }
         }
    }
    private static byte[] decode(Map<Byte,String> huffmanCodes, byte[] huffmanBytes) {  //前一个参数是编码表，后一个参数是最后的转化结果
        //1.先得到huffmanBytes对应的二进制的字符串，形式1010100010111...
        StringBuilder stringBuilder = new StringBuilder();
        //将byte数组转成二进制的字符串
        for (int i = 0; i < huffmanBytes.length; i++) {
            byte b = huffmanBytes[i];
            //判断是不是最后一个字节
            boolean flag = (i == huffmanBytes.length - 1);
            stringBuilder.append(byteToBitString(!flag, b));
        }
//        System.out .println("赫夫曼字节数组对应的二进制字符串="+ stringBuilder.toString());
        //把字符串安装指定的赫夫曼编码进行解码
        //把赫夫员编码表进行调换，因为反向查询a->100100->a
        Map<String, Byte> map = new HashMap<String, Byte>();
        for (Map.Entry<Byte, String> entry : huffmanCodes.entrySet()) {
            map.put(entry.getValue(), entry.getKey());
        }
//创建要给集合，存放byte
        List<Byte> list = new ArrayList<>();
//i可以理 解成就足索引,扫描 stringBuilder
        for (int i = 0; i < stringBuilder.length(); i++ ) {
            int count = 1; //小的计数器
            boolean flag = true;
            Byte b = null;
            while (flag) {
                //1010100010111...
                // 递增的职出key 1
                String key = stringBuilder.substring(i,i+count);//i 不动，让count移动，指定匹配到一个字符
                b = map.get(key);
                if (b == null) {//说明没有匹配到
                    count++;
                } else {
                    //匹配到
                    flag = false;
                }
                list.add(b);
                i += count;//i 百接移动到count
            }
        }
        //当for循环结束后，我们list中就存放了所有的字符"i like like like java do you like a java
        //把list中的数据放入到byte[]并返回
        byte b[] = new byte[list.size()];
        for(int i= 0;i < b.length; i++) {
            b[i] = list.get(i);
        }
        return b;
    }

    private static String byteToBitString(boolean flag, byte b) {
         //使用变量保存b
        int temp = b; //将b转成int
          //如果是正数我们还存在补高位
        if(flag) {
            temp |= 256; //按位与256 1 0000 0000| 0000 0001 => 1 0000 0001
        }
        String str = Integer.toBinaryString(temp); //返回的是temp对应的二进制的补码
        if(flag) {
            return str.substring(str.length()-8);
        } else {
            return str;
        }
    }

}
//创建Node,存放待数据和权值
class Node implements Comparable<Node>{
    Byte data;  // 存放数据(字符)本身， 比如'a'=>97
    int weight;  //权值，表示字符出现的次数
    Node right;  //右子树
    Node left;   //左子树
    public Node(Byte data,int weight){
        this.data=data;
        this.weight=weight;
    }

    @Override
    public int compareTo(Node o) {
        return this.weight-o.weight;  //权值按照从小到大排列
    }

    @Override
    public String toString() {
        return "Node{" +
                "data=" + data +
                ", weight=" + weight +
                '}';
    }

    //前序遍历
    public void pre(){
        System.out.println(this);
        if (this.left!=null){
            this.left.pre();
        }
        if (this.right!=null){
            this.right.pre();
        }
    }
}

赫夫曼解码(day17)的更多相关文章

【算法】赫夫曼树（Huffman）的构建和应用（编码、译码）
参考资料 <算法(java)> — — Robert Sedgewick, Kevin Wayne <数据结构> ...
【数据结构】赫夫曼树的实现和模拟压缩(C++)
赫夫曼(Huffman)树,由发明它的人物命名,又称最优树,是一类带权路径最短的二叉树,主要用于数据压缩传输. 赫夫曼树的构造过程相对比较简单,要理解赫夫曼数,要先了解赫夫曼编码. 对一组出现频率不同 ...
赫夫曼树JAVA实现及分析
一,介绍 1)构造赫夫曼树的算法是一个贪心算法,贪心的地方在于:总是选取当前频率(权值)最低的两个结点来进行合并,构造新结点. 2)使用最小堆来选取频率最小的节点,有助于提高算法效率,因为要选频率最低 ...
Android版数据结构与算法(七):赫夫曼树
版权声明:本文出自汪磊的博客,未经作者允许禁止转载. 近期忙着新版本的开发,此外正在回顾C语言,大部分时间没放在数据结构与算法的整理上,所以更新有点慢了,不过既然写了就肯定尽力将这部分完全整理好分享出 ...
Java数据结构和算法（四）赫夫曼树
Java数据结构和算法(四)赫夫曼树数据结构与算法目录(https://www.cnblogs.com/binarylei/p/10115867.html) 赫夫曼树又称为最优二叉树,赫夫曼树的一个 ...
javascript实现数据结构：树和二叉树的应用--最优二叉树（赫夫曼树），回溯法与树的遍历--求集合幂集及八皇后问题
赫夫曼树及其应用赫夫曼(Huffman)树又称最优树,是一类带权路径长度最短的树,有着广泛的应用. 最优二叉树(Huffman树) 1 基本概念 ① 结点路径:从树中一个结点到另一个结点的之间的分支 ...
重温经典之赫夫曼(Huffman)编码
先看看赫夫曼树假设有n个权值{w1,w2,…,wn},构造一个有n个叶子结点的二叉树,每个叶子结点权值为wi,则其中带权路径长度WPL最小的二叉树称作赫夫曼树或最优二叉树. 赫夫曼树的构造,赫夫曼最早 ...
c++实现哈夫曼树，哈夫曼编码，哈夫曼解码（字符串去重，并统计频率）
#include <iostream> #include <iomanip> #include <string> #include <cstdlib> ...
puk1521 赫夫曼树编码
Description An entropy encoder is a data encoding method that achieves lossless data compression by ...

随机推荐

Linux系统提示无法获得锁
这种情况出现主要是因为软件更新或者安装时出现错误. 删除掉两个临时文件即可 sudo rm /var/lib/dpkg/lock sudo rm /var/cache/apt/archive/lock ...
如何修改Jquery Mobile 设置默认选项
以下的默认配置可以通过$.mobile对象重新配置自定义命名空间s (字符, 默认: ""): 在jQuery Mobile中,甚至可以自定义象HTML5中的data-attrib ...
一维跳棋（BFS）
一维跳棋是一种在1×(2N+1) 的棋盘上玩的游戏.一共有N个棋子,其中N 个是黑的,N 个是白的.游戏开始前,N 个白棋子被放在一头,N 个黑棋子被放在另一头,中间的格子空着. 在这个游戏里有两种移 ...
题解 P2382 【化学分子式】
题目不懂为什么,本蒟蒻用在线算法打就一直炸...... 直到用了"半离线"算法...... 一遍就过了好吗...... 某位机房的小伙伴一遍就过了另一位机房的小伙伴也是每次都爆 ...
三、VIP课程：并发编程专题->01-并发编程之Executor线程池详解
01-并发编程之Executor线程池详解线程:什么是线程&多线程线程:线程是进程的一个实体,是 CPU 调度和分派的基本单位,它是比进程更小的能独立运行的基本单位.线程自己基本上不拥有系 ...
Ubuntu---Git
本篇文章简单总结了常用 Git 的使用前言设置用户信息 1, Git 是分布式的 SSH 代码管理工具,远程的代码管理是基于 SSH 的,所以要使用远程的 Git 则需要 SSH 的配置. ste ...
python——logging模块
简介: 日志是一种可以追踪某些软件运行时所发生事件的方法.软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了某些事情.不同的事件,被区分在不同的等级中,故通过log分析,可以很轻易地分析 ...
servlet 3 通过编程的方式来配置ServletContext
你是否再为配置文件web.xml容易出错而烦恼?是否为web.xml文件存放位置而不知所措?是否为web.xml为什么要这样配?怎么才能更好的配置web.xml而烦恼?那么一种新的方式出现了: spr ...
关于sql更新最后一个逗号的去除或则最后的and的去除
去除最后的逗号substr_replace($update_sql ,"",-1);去除最后的and substr_replace($update_sql ,"" ...
java常用工具类（一）
一.String工具类 package com.mkyong.common; import java.util.ArrayList; import java.util.List; /** * * St ...

赫夫曼解码(day17)

思路：

代码：

赫夫曼解码(day17)的更多相关文章

随机推荐

热门专题