使用F#来实现哈夫曼编码吧
最近算法课要求实现哈夫曼编码,由于前面的问题都是使用了F#来解决,偶然换成C#也十分古怪,报告也不好看,风格差太多。一开始是打算把C#版本的哈夫曼编码换用F#来写,结果写到一半就觉得日了狗了。。。毕竟FP水平图样,到处mutable,各种<-
...于是想看看有没有现成的F#实现的哈夫曼编码。
F#的算法实现这种东西本身不好找,不过M$似乎有着预见性,得来全不费功夫。。。
open System
/// 哈夫曼编码使用了一个叶子节点为输入符号,
/// 内部节点是他们所有符号组合的期望频率的
/// 二叉树。
type HuffmanTree =
| Leaf of char * float
| Node of float * HuffmanTree * HuffmanTree
/// 为包含给定符号的字符串和期望的频率提供编码和解码
type HuffmanCoder(symbols: seq<char>, frequencies : seq<float>) =
/// 从输入的频率构建一个哈夫曼编码树
let huffmanTreeLeafs =
Seq.zip symbols frequencies
|> Seq.toList
|> List.map Leaf
/// 用于从哈夫曼编码树的节点获取频率
let frequency node =
match node with
| Leaf(_,p) -> p
| Node(p,_,_) -> p
/// 从根节点列表构建一个哈夫曼编码树,遍历它直到唯一根节点
let rec buildCodeTree roots =
match roots |> List.sortBy frequency with
| [] -> failwith "Cannot build a Huffman Tree for no inputs"
| [node] -> node
| least::nextLeast::rest ->
let combinedFrequency = frequency least + frequency nextLeast
let newNode = Node(combinedFrequency, least, nextLeast)
buildCodeTree (newNode::rest)
let tree = buildCodeTree huffmanTreeLeafs
/// 为哈夫曼编码树的所有叶子构建哈夫曼编码表
let huffmanCodeTable =
let rec huffmanCodes tree =
match tree with
| Leaf (c,_) -> [(c, [])]
| Node (_, left, right) ->
let leftCodes = huffmanCodes left |> List.map (fun (c, code) -> (c, true::code))
let rightCodes = huffmanCodes right |> List.map (fun (c, code) -> (c, false::code))
List.append leftCodes rightCodes
huffmanCodes tree
|> List.map (fun (c,code) -> (c,List.toArray code))
|> Map.ofList
/// 使用哈夫曼编码表编码字符串
let encode (str:string) =
let encodeChar c =
match huffmanCodeTable |> Map.tryFind c with
| Some bits -> bits
| None -> failwith "No frequency information provided for character '%A'" c
str.ToCharArray()
|> Array.map encodeChar
|> Array.concat
/// 使用哈夫曼编码树将一个二进制数组解码为字符串
let decode bits =
let rec decodeInner bitsLeft treeNode result =
match bitsLeft, treeNode with
| [] , Node (_,_,_) -> failwith "Bits provided did not form a complete word"
| [] , Leaf (c,_) -> (c:: result) |> List.rev |> List.toArray
| _ , Leaf (c,_) -> decodeInner bitsLeft tree (c::result)
| b::rest , Node (_,l,r) -> if b
then decodeInner rest l result
else decodeInner rest r result
let bitsList = Array.toList bits
new String (decodeInner bitsList tree [])
member coder.Encode source = encode source
member coder.Decode source = decode source
模式匹配##
模式匹配是F#中相当基本并且非常强大的特性。使用模式匹配可以让代码在清晰地表达其行为的同时更加简洁。上方所陈的每一个函数都使用到了模式匹配——亦是大量的F#典型代码。
简单说来,比如在
huffmanCodes
里,模式匹配使得其可以在可能出现的联合数据结构中轻松切换:match tree with
| Leaf (c,_) -> //...
| Node (_, left, right) -> //...
更多复杂的例子(比如上面的
decodeInner
)不难发现模式匹配有助于引导你的代码。你例举了每一个你知道如何处理的情形,并且你所匹配的叶子节点暗示了数据需要在那种情形下定义。然后编译器将会热情地告诉你你有哪些没有覆盖到的情形。当我一开始撰写这个函数的时候,我就没有考虑到第一种情况,然后编译器告诉我Warning: Incomplete pattern matches on this expression. The value '([],Node (_, _, _))' will not be matched
很明显对了!这个特定的输入指示了用户可能提供非法输入!
管道##
管道是一个用来描述声明一系列输入执行操作的不错的方式。这种哲学思想类似于在命令行里的管道——将左边的输入作为参数传递给右边。
因为F#库提供了一票很好的基本类型的操作用于处理你的数据,所以很容易通过管道描述这一系列的转换操作。例如,您可以很容易地声明筛选、映射、折叠、压缩或是重新包装数据。
集合##
代码使用了4种常用 F#/.NET 集合:
- F# 列表:不可变链表,在一个用到了列表的递归算法里用到了。
- F# 映射:不可变字典,用于存储每个符号。
- F# 序列 = .NET "IEnumerable":基本集合的接口,用于输入。
- .NET 数组:基本类型的数组用于输出编码。
值得注意的是,在集合间切换非常容易,使用诸如
List.toArray
、Map.ofList
的函数就能轻松搞定。“这是.NET的一部分!”又曰“华而不实”##
当我写这段代码的时候,我开启了实验模式,我仅仅在表层写了一些小的函数然后用F# Interactive来执行。当我觉得这个函数工作正常便想将所有的功能使用一个类来包装起来,然后给出一个漂亮的.NET接口,我就是这样做的:
把所有的内容拍到一个级别
把代码包裹起来:
type HuffmanCoder(symbols : seq<char>, frequencies : seq<float>) = // 要包裹的代码... member coder.Encode source = encode source
member coder.Decode source = decode source
真是不能低估这神奇的能力!在F#里,从实验编码到零件设计编码的过渡简单而平稳。之所以F#可以这么来,是因为其是一个混合了函数式和面向对象的语言并且巧妙地被集成进了.NET。并且正是因为这个缘故,使用F#可以轻松构建大型.NET系统的组件。我听说有人对F#中的函数式面向对象批评曰其“华而不实”,但是我非常喜欢它,因为不论什么时候它都能让我纵享丝滑。
使用F#来实现哈夫曼编码吧的更多相关文章
- 哈夫曼(huffman)树和哈夫曼编码
哈夫曼树 哈夫曼树也叫最优二叉树(哈夫曼树) 问题:什么是哈夫曼树? 例:将学生的百分制成绩转换为五分制成绩:≥90 分: A,80-89分: B,70-79分: C,60-69分: D,<60 ...
- (转载)哈夫曼编码(Huffman)
转载自:click here 1.哈夫曼编码的起源: 哈夫曼编码是 1952 年由 David A. Huffman 提出的一种无损数据压缩的编码算法.哈夫曼编码先统计出每种字母在字符串里出现的频率, ...
- 数据结构图文解析之:哈夫曼树与哈夫曼编码详解及C++模板实现
0. 数据结构图文解析系列 数据结构系列文章 数据结构图文解析之:数组.单链表.双链表介绍及C++模板实现 数据结构图文解析之:栈的简介及C++模板实现 数据结构图文解析之:队列详解与C++模板实现 ...
- 赫夫曼\哈夫曼\霍夫曼编码 (Huffman Tree)
哈夫曼树 给定n个权值作为n的叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree).哈夫曼树是带权路径长度最短的树,权值较大的结点离 ...
- java 哈夫曼编码
//哈夫曼树类 public class HaffmanTree { //最大权值 ; int nodeNum ; //叶子结点个数 public HaffmanTree(int n) { this. ...
- java实现哈夫曼编码
java实现哈夫曼编码 哈夫曼树 既然是学习哈夫曼编码,我们首先需要知道什么是哈夫曼树:给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫 ...
- 哈夫曼(Huffman)树和哈夫曼编码
一.哈夫曼(Huffman)树和哈夫曼编码 1.哈夫曼树(Huffman)又称最优二叉树,是一类带权路径长度最短的树, 常用于信息检测. 定义: 结点间的路径长度:树中一个结点到另一个结点之间分支数目 ...
- 20172332 2017-2018-2 《程序设计与数据结构》Java哈夫曼编码实验--哈夫曼树的建立,编码与解码
20172332 2017-2018-2 <程序设计与数据结构>Java哈夫曼编码实验--哈夫曼树的建立,编码与解码 哈夫曼树 1.路径和路径长度 在一棵树中,从一个结点往下可以达到的孩子 ...
- haffman哈夫曼编码的实现
<span style="font-size:18px;">/* 1.在一棵二叉树中,我们定义从A节点到B节点所经过的分支序列为从A节点到B节点的路径: 定义从A节点到 ...
随机推荐
- CR LF的由来
学习Esperanto时用到一款叫做Kajero的软件,支持世界语特殊字符编辑. 在Option菜单中有个选项,End of line 列出了四种换行方式 这四种都是由基本CR和LF组成.那么CR和L ...
- modesim测试语句
: 'd2; Reg2 <= Reg1; i <= i + 1'b1; join : 'd2; i <= i + 1'b1; join : 'd2; Reg2 <= Reg1; ...
- HTML 判断手机的类型(苹果手机安卓手机)
function isJudege_PlatForm() { var version = navigator.appVersion; var platName = navigator.userAgen ...
- [06]APUE:系统数据文件和信息
[a] getpwent / setpwent / endpwent #include <pwd.h> struct passwd *getpwent(void) //成功返回指针,出错或 ...
- RSpec shared examples with template methods
It’s pretty common to have multiple tests that are nearly the same. In one app, we support bidding o ...
- text-shadow文字阴影属性用法
text-shadow:offset-x:阴影水平移动,负值时向左偏移 text-shadow:offset-y:阴影垂直移动,负值时向上移动 text-shadow:radio-bluer:阴影到实 ...
- C#装箱和拆箱
1.装箱是将值类型转换为引用类型(或者转换为此值类型所实现的任何接口类型)的隐式转换,当 CLR 对值类型进行装箱时,会将该值包装到 System.Object 内部,再将后者存储在托管堆上. ; / ...
- PHP对象转数组||PHP数组转对象
function arrayToObject($e){ if( gettype($e)!='array' ) return; foreach($e as $k=>$v){ ...
- Samba的安装与配置
Samba的安装与配置: 准备:关闭其他虚拟设备 #/etc/init.d/libvirtd stop #/etc/init.d/xend stop #chkconfig libvirtd off # ...
- fcc
function spinalCase(str) { if(str.split(/\W|_/).length==1){ for(var i=0;i<str.length;i++){ if(/[A ...