散列表的实现 -- 数据结构与算法的javascript描述 第八章
散列表(哈希表
散列是一种常用的数据存储技术,散列后的数据可以快速地插入或取用。
散列表需要一个散列值(key)来存储指定数据,取数据也是依靠此。
散列值可以依靠计算数据的 ASCII码来获得,但是这会有一个问题,若干数据的散列值可能会相同,这样存储就会发生碰撞。
方案:
开链法, 对Hash表中每个Hash值建立一个冲突表,即将冲突的几个记录以表的形式存储在其中
开放寻址散列,当发生碰撞时,线性探测法检查散列表中的下一个位置是否为空。如果为空,就将数据存入该位置;如果不为空,则继续检查下一个位置,直到找到一个空的位置为止。
第一版code
//版本一 (字符串类型的键
//因其对散列值处理中 有碰撞的可能。
//不具备处理碰撞数据的能力(有可能散列值相同,会把上一个值覆盖掉)
function HashTable(){
var me = this;
me.table = new Array(137);
me.simpleHash = simpleHash;
me.showDistro = showDistro;
me.showPutLength = showPutLength;
//统计有多少数据进入散列表
me.putLength = 0;
me.put = put;
/**
* 取散列值 *取每个字符的ASCII码值之和
* @param s
* @returns {number}
*/
function simpleHash(s){
var total = 0;
for (var i = 0; i < s.length; ++i) {
total += s.charCodeAt(i);
}
return total % me.table.length;
}
function put(data){
me.putLength++;
var pos = me.simpleHash(data);
me.table[pos] = data;
}
function showDistro(){
var s = '',i=0;
for(;i<me.table.length;i++){
if (me.table[i] != undefined) {
s+=" key: "+ i+" , value:"+me.table[i] +" \n";
}
}
console.log(s)
}
function showPutLength(){
console.log("共有 "+me.putLength+" 次插入散列表行为");
return me.putLength;
}
}
第一版测试
//版本一测试
var someNames = [
"David",
"Jennifer",
"Donnie",
"Raymond",
"Cynthia",
"Mike",
"Clayton",
"Danny",
"Jonathan"
];
var hTable = new HashTable();
for (var i = 0; i < someNames.length; ++i) {
hTable.put(someNames[i]);
}
hTable.showPutLength();
hTable.showDistro();
版本一的数据碰撞处理有问题。我们修改一个版本来优化这个地方。
新的散列值计算方式用了 霍纳算法的思想,乘以一个质数来尽量避免碰撞。
function HashTable2(){
var me = this;
me.table = new Array(137);
me.simpleHash = simpleHash;
me.showDistro = showDistro;
me.showPutLength = showPutLength;
me.put = put;
//统计有多少数据进入散列表
me.putLength = 0;
//质数,当该数字式37时候 也会碰撞 +_+
me.H = 31;
//第二版 修正碰撞问题(只能说 尽可能减少碰撞 霍纳算法
//为了避免碰撞,首先要确保散列表中用来存储数据的数组其大小是个质数
//新的散列函数仍然先计算字符串中各字符的ASCII码值,不过求和时每次要乘以一个质数。
/**
* 取散列值 *取每个字符的ASCII码值之和
* @param s
* @returns {number}
*/
function simpleHash(s){
var total = 0;
for (var i = 0; i < s.length; ++i) {
total += me.H * total + s.charCodeAt(i);
}
total = total % me.table.length;
if (total < 0) {
total += me.table.length-1;
}
return parseInt(total);
}
function put(data){
me.putLength++;
var pos = me.simpleHash(data);
me.table[pos] = data;
}
function showDistro(){
var s = '',i=0;
for(;i<me.table.length;i++){
if (me.table[i] != undefined) {
s+=" key: "+ i+" , value: "+me.table[i] +" \n";
}
}
console.log(s)
}
function showPutLength(){
console.log("共有 "+me.putLength+" 次插入散列表行为");
return me.putLength;
}
}
散列表总结
实现一个散列表存储最主要的问题就是解决 碰撞问题。
碰撞原因:
我们要将一个字符或者整型键进行存储,需要对其进行计算散列值(计算方式为每个字符的ASCII码值相加,尽管计算方法升级优化了 仍会有碰撞的可能),但是不同的字符或者整形可能计算出同一个散列值,这样就会发生碰撞,后面插入的值会覆盖前面的值。
比如 “Clayton”与 “Raymond” 计算后的散列值一样。
为了尽量避免碰撞,我们对计算散列值的方法进行了优化,新的散列函数仍然先计算字符串中各字符的ASCII码值,不过求和时每次要乘以一个质数。具体可以搜索:[霍纳算法],注: 这一版本 虽然优化了计算方法,仍然有碰撞的可能
碰撞处理:
开链法:
是指实现散列表的底层数组中,每个数组元素又是一个新的数据结构,比如另一个数组,这样就能存储多个键了。使用这种技术,即使两个键散列后的值相同,依然被保存在同样的位置,只不过它们在第二个数组中的位置不一样罢了
开链法的可能存储结构:
[ [1],
[2],
[3,3,3,3] //多个数据 散列值一样,但是存储在同一位置不同下标中。
]
实现开链法的方法是:在创建存储散列过的键值的数组时,通过调用一个函数创建一个新的空数组,然后将该数组赋给散列表里的每个数组元素。这样就创建了一个二维数组
线性探测法:
当发生碰撞时,线性探测法检查散列表中的下一个位置是否为空。如果为空,就将数据存入该位置;如果不为空,则继续检查下一个位置,直到找到一个空的位置为止。该技术是基于这样一个事实:每个散列表都会有很多空的单元格,可以使用它们来存储数据
到此为止,只是了解了如何实现不碰撞的方法,但碍于水平有限,并未实现完整的代码,所以就不贴出来了。希望能对看到的人有所帮助~。
散列表的实现 -- 数据结构与算法的javascript描述 第八章的更多相关文章
- 检索算法 -- 数据结构与算法的javascript描述 第13章
检索算法-如何在列表中查找特定的值. 顺序查找 从列表的第一个元素开始对列表元素逐个进行判断,直到找到了想要的结果,它属于暴力查找技巧的一种,在执行查找时可能会访问到数据结构里的所有元素. 代码: / ...
- 排序算法 -- 数据结构与算法的javascript描述 第12章
排序是常见的功能,给定一组数据,对其进行排序. 在此之前,我们需要准备个基础工作--自动生成数组,并可以对该组数据做任何处理. /** * 测试类 ,数组 * @param numElements * ...
- 二叉树的实现 -- 数据结构与算法的javascript描述 第十章
/** * 树,一种非线性的数据结构. 以分层的方式存储数据. * 一棵树最上面的节点成为根节点,如果一个节点下面有多个节点,这个节点称为父节点,下面的节点称为子节点 * 没有任何子节点的节点,陈宝国 ...
- 集合的实现 -- 数据结构与算法的javascript描述 第九章
集合 集合(set)是一种包含不同元素的数据结构. 集合中的元素称为成员. 集合的两个最重要特性是:首先,集合中的成员是无序的:其次,集合中不允许相同成员存在. code function Set() ...
- 字典 -- 数据结构与算法的javascript描述 第七章
字典 字典是一种以键-值对形式存储数据的数据结构 最基本功能规划 add 添加数据到字典 remove 从字典中移除数据 get 从字典中取出数据 count 统计字典数据量 find 查找数据在字典 ...
- 队列的实现 -- 数据结构与算法的javascript描述 第五章
队列也是列表的一种,有不同于列表的规则. 先进先出 入队方法 出队方法 可以找到队首 可以找到队尾 可以查看队列有多长 可以查看队列是否为空 这是一个基本的需求,围绕他来实现,当然我们可以自己扩展列表 ...
- 链表的实现 -- 数据结构与算法的javascript描述 第六章
链表 链表是由一组节点组成的集合.每个节点都使用一个对象的引用指向它的后继.指向另一个节点的引用叫做链 结构示意图 : 链表头需要我们标识 head { element:head,next:obj1 ...
- 栈的实现 -- 数据结构与算法的javascript描述 第四章
栈 :last-in-first-out 栈有自己特殊的规则,只能 后进入的元素 ,最先被推出来,我们只需要模拟这个规则,实现这个规则就好. peek是返回栈顶元素(最后一个进入的). /** * 栈 ...
- 列表的实现-----数据结构与算法JavaScript描述 第三章
实现一个列表 script var booklist = new List(); booklist.append('jsbook'); booklist.append('cssbook'); book ...
随机推荐
- 在 Windows Azure 网站中进行纵向扩展和横向扩展
编辑人员注释:本文章由 Windows Azure 网站团队的项目经理 Byron Tardif 撰写. 当您开始一个新的 Web 项目,或者刚刚开始开发一般的网站和应用程序时,您可能希望从小处着手. ...
- 使用 Node.js 做 Function Test
Info 上周 meeting 上同事说他们现在在用 java 写 function test,产生了很多冗余的代码,整个项目也变得比较臃肿.现在迫切需要个简单的模板项目能快速搭建function t ...
- Hadoop HA部署
因为公司旧系统的Hadoop版本是2.2,所以在部署新系统时使用了旧系统. 但是在部署ResourceManager auto failover时发现其他nodemanager总是向0.0.0.0请求 ...
- 谷歌page speed 安装使用及页面问题详解
原文地址:http://wenku.baidu.com/view/b0a61f3ebcd126fff7050b40.html 谷歌page speed 安装使用及页面问题详解 谷歌page speed ...
- JQuery(下)
26.jQuery 中的 DOM 操作 )DOM(Document Object Model—文档对象模型):一种与浏览器, 平台, 语言无关的接口, 使用该接口可以轻松地访问页面中所有的标准组件 ) ...
- #include <fstream>
1 fstream 2 ifstream 3 ofstream 4 seekg 5 seekp 6 tellg 7 tellp 1 fstream 打开输入输出文件流 #include <ios ...
- Unity插件之NGUI学习(1)—— 环境搭建
Unity官网http://unity3d.com/unity/download下载最新版本号4.5.4 在圣典论坛上找到破解补丁(Windows)版本号tid=18741&fid=8&quo ...
- 深入理解CSS3 Animation 帧动画(转)
CSS3我在5年之前就有用了,包括公司项目都一直在很前沿的技术. 最近在写慕课网的七夕主题,用了大量的CSS3动画,但是真的沉淀下来仔细的去深入CSS3动画的各个属性发现还是很深的,这里就写下关于帧动 ...
- CSS的“层叠”规则的总结
当你随机打开一个页面,查看源代码,你会发现,同一个元素,不止有一个CSS选择器及对应的样式.而一个元素只能应用一个样式,那么一堆样式中究竟是应用哪一个呢?这就涉及到CSS的层叠规则了.下面就来总结下C ...
- 利用汇编查看C++函数调用
这篇文章的内容是一个老生常谈的问题----> 函数是如何被调用的. 本文用汇编代码研究函数调用的过程,参数调用的方式,函数值的返回. 1. 函数是如何实现调用的 函数的调用是用call 和 re ...