字符串哈希算法（以ELFHash详解）

更多字符串哈希算法请参考：http://blog.csdn.net/AlburtHoffman/article/details/19641123

先来了解一下何为哈希：

哈希表是根据设定的哈希函数H(key)和处理冲突方法将一组关键字映射到一个有限的地址区间上，并以关键字在地址区间中的象作为记录在表中的存储位置，这种表称为哈希表或散列，所得存储位置称为哈希地址或散列地址。作为线性数据结构与表格和队列等相比，哈希表无疑是查找速度比较快的一种。

通过将单向数学函数（有时称为“哈希算法”）应用到任意数量的数据所得到的固定大小的结果。如果输入数据中有变化，则哈希也会发生变化。哈希可用于许多操作，包括身份验证和数字签名。也称为“消息摘要”。

简单解释：哈希(Hash)算法,即散列函数。它是一种单向密码体制,即它是一个从明文到密文的不可逆的映射,只有加密过程,没有解密过程。同时,哈希函数可以将任意长度的输入经过变化以后得到固定长度的输出。哈希函数的这种单向特征和输出数据长度固定的特征使得它可以生成消息或者数据。

个人心得：哈希就是用进行函数映射，用key对应此时的值，然后对这个值进行查询时直接对key的地址进行查看就好了，思想简单，用起来真的复杂。我们还是简单学一下ELFHash吧

// ELF Hash Function

 2 unsigned int ELFHash(char *str)

 3 {

 4     unsigned int hash = 0;

 5     unsigned int x = 0;

 6

 7     while (*str)

 8     {

 9         hash = (hash << 4) + (*str++);//hash左移4位，把当前字符ASCII存入hash低四位。

10         if ((x = hash & 0xF0000000L) != 0)

11         {

12             //如果最高的四位不为0，则说明字符多余7个，现在正在存第7个字符，如果不处理，再加下一个字符时，第一个字符会被移出，因此要有如下处理。

13             //该处理，如果最高位为0，就会仅仅影响5-8位，否则会影响5-31位，因为C语言使用的算数移位

14             //因为1-4位刚刚存储了新加入到字符，所以不能>>28

15             hash ^= (x >> 24);

16             //上面这行代码并不会对X有影响，本身X和hash的高4位相同，下面这行代码&~即对28-31(高4位)位清零。

17             hash &= ~x;

18         }

19     }

20     //返回一个符号位为0的数，即丢弃最高位，以免函数外产生影响。(我们可以考虑，如果只有字符，符号位不可能为负)

21     return (hash & 0x7FFFFFFF);

22 }

然后用一个例题实践一下吧吧，hdu1800

#include <bits/stdc++.h>

using namespace std;

typedef unsigned int ui;

const int N = 7003, MOD = 7003;

int Hash[N], num[N];

int res;

int ELFhash(char *str)//思想就是一直杂糅，使字符之间互相影响

{

    ui h = 0, g;

    while(*str)

    {

        h = (h<<4) + *str++; //h左移4位，当前字符占8位，加到h中进行杂糅

        if((g = h & 0xf0000000) != 0) //取h最左四位的值，若均为0，则括号中执行与否没区别，故不执行

        {

            h ^= g>>24; //用h的最左四位的值对h的右起5~8进行杂糅

            h &= ~g;//清空h的最左四位

        }

    }

    return h; //因为每次都清空了最左四位，最后结果最多也就是28位二进制整数，不会超int

}

void hash_table(char *str)

{

    int k = ELFhash(str);

    int t = k % MOD;

    while(Hash[t] != k && Hash[t] != -1) t = (t + 1) % MOD;//开放地址法处理hash

    if(Hash[t] == -1) num[t] = 1, Hash[t] = k;

    else res = max(res, ++num[t]);

}

int main()

{

    int n;

    char str[100];

    while(~ scanf("%d", &n))

    {

        getchar();

        res = 1;

        memset(Hash, -1, sizeof Hash);

        for(int i = 1; i <= n; i++)

        {

            scanf("%s", str);

            int j = 0;

            while(str[j] == '0') j++;

            hash_table(str + j);

        }

        printf("%d\n", res);

    }

    return 0;

}

ELFhash的更多相关文章

ELFHash算法解释
// ELF Hash Function unsigned int ELFHash(char *str) { unsigned int hash = 0; unsigned int x = 0; wh ...
字符串哈希算法（以ELFHash详解）
更多字符串哈希算法请参考:http://blog.csdn.net/AlburtHoffman/article/details/19641123 先来了解一下何为哈希: 哈希表是根据设定的哈希函数H( ...
ELFhash - 优秀的字符串哈希算法
ELFhash - 优秀的字符串哈希算法 2016年10月29日 22:12:37 阅读数:6440更多个人分类: 算法杂论算法精讲数据结构所属专栏: 算法与数据结构版权声明:本文为博主原创 ...
hash算法总结收集
hash算法的意义在于提供了一种快速存取数据的方法,它用一种算法建立键值与真实值之间的对应关系,(每一个真实值只能有一个键值,但是一个键值可以对应多个真实值),这样可以快速在数组等条件中里面存取数据. ...
各种字符串Hash函数比较（转）
常用的字符串Hash函数还有ELFHash,APHash等等,都是十分简单有效的方法.这些函数使用位运算使得每一个字符都对最后的函数值产生影响.另外还有以MD5和SHA1为代表的杂凑函数,这些函数几乎 ...
哈希(Hask)
编辑 Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值.这种转换是一种压缩映射 ...
常用的Hash算法
1.RSHash unsigned int RSHash(const std::string& str) { unsigned int b = 378551; unsigne ...
海量字符串查找——bloom filter,c
对于海量字符串的查找,一般有两种方法,一种是建树,还有一种就是bf算法,即布隆过滤器,这个从原来上讲比较简单,也易于实现,主要就是根据哈希算法来实现. int len(char *ch) { int ...
一些常用的字符串hash函数
unsigned int RSHash(const std::string& str) { unsigned int b = 378551; unsigned int a = 63689; u ...

随机推荐

Resharper插件如何启用原VS的智能提示
第一步:vs2015选择工具—>选项—>文本编辑器—>C#—>常规—>语句结束,勾选自动列出成员,如下图: 第二步: 关闭Resharper智能提示,并设置为Visual ...
word-wrap与break-word属性的区别
共同点 word-wrap:break-word与word-break:break-all都能把长单词强行断句不同点 word-wrap:break-word会首先起一个新行来放置长单词,新的行还是 ...
十九. Python基础(19)--异常
十九. Python基础(19)--异常 1 ● 捕获异常 if VS异常处理: if是预防异常出现, 异常处理是处理异常出现异常处理一般格式: try: <............. ...
SQL-15 查找employees表所有emp_no为奇数，且last_name不为Mary的员工信息，并按照hire_date逆序排列
题目描述查找employees表所有emp_no为奇数,且last_name不为Mary的员工信息,并按照hire_date逆序排列CREATE TABLE `employees` (`emp_no ...
DevExpress WinForms v18.2新版亮点（二）
行业领先的.NET界面控件2018年第二次重大更新——DevExpress v18.2日前正式发布,本站将以连载的形式为大家介绍各版本新增内容.本文将介绍了DevExpress WinForms v1 ...
poj2406(kmp算法）
Given two strings a and b we define a*b to be their concatenation. For example, if a = "abc&quo ...
Oracle存储过程基础
http://blog.sina.com.cn/s/blog_67e424340100iyg1.html
解决jsp表达式不能解析的问题
在jsp页面用了表达式,但是出现了表达式不能解析的问题出现的页面如下原因:web.xml的版本过低,maven自动生成的web.xml版本为2.3,只有2.3以上的版本才支持表达式解决方法:改w ...
ajax异步上传图片(TP5)
直接上代码 PHP代码如下 /** * 上传 */ public function upload_photo(){ $file = $this->request->file('file') ...
JAVA_概念01_跨域
1.什么是跨域? 协议.域名.端口都相同是同域,否则是跨域. 服务器不允许ajax跨域获取数据 2.解决办法? ①jsonp :Jsonp不是一种数据格式,而json是一种数据格式,jsonp是用来解 ...

ELFhash

字符串哈希算法（以ELFHash详解）

ELFhash的更多相关文章

随机推荐

热门专题