本文搜集了一些字符串的常用hash函数。

范例1:判断两个单词是否含有相同的字母,此时我们可以用hash做。例如,“aaabb”与"aabb"含有相同的单词。(参考:http://kmplayer.iteye.com/blog/656782

#include <iostream>
using namespace std; int hash(const char* a) //hash函数设计到位,节约了空间,当然我们也可以用bitset
{
int tmp=0;
while(*a)
{
tmp|=1<<(*a-'a');
a++;
}
return tmp;
} int main()
{
char* a="abc";
char* b="acb";
cout<<hash(a)<<endl;
cout<<hash(b)<<endl;
return 0;
}

范例2:判断兄弟单词,兄弟单词定义为两个单词含有的所有字母相同,但是位置不同。例如“aaccdd”和“acdacd”。何海涛在《剑指offer》上的解法,定义bitcnt[26],用一个字符串加计数,另一个字符串减计数。

我们这里为了素数的hash构造方法。特意用素数来hash,例如,a=2,b=3,c=5,然后整个单词的hash就是其乘积。

#include <iostream>
#include <cctype>
using namespace std; const int MAX = 200;
int prime[MAX] = {2,3,5}; //产生小于num的所有素数,返回值为产生素数的个数
int GeneratePrime(int num)
{
int curPossibleNum = 5;
int gap = 2;
int count = 3; while(curPossibleNum <= num){
curPossibleNum += gap;
bool flag = true; for(int j=0; prime[j]*prime[j]<=curPossibleNum; j++){
if(curPossibleNum % prime[j] == 0)
flag = false;
} if(flag == true)
prime[count++] = curPossibleNum; gap = 6 - gap;
} return count;
} long long Hash(char str[]){ //在这里我们简单的将大小写统一
long long hashValue = 1;
while(*str != '\0'){
hashValue = hashValue * prime[tolower(*str) - 'a'];
++str;
}
return hashValue;
} int main()
{
char* str="abdc";
GeneratePrime(26);
cout<<Hash(str)<<endl;
system("pause");
return 0;
}

范例3:统计单词的个数,C++ Primer中采用map的方法。本文采用介绍采用hash的方法。(参考:http://kmplayer.iteye.com/blog/647471

#include <stdio.h>
#include <stdlib.h>
#include <string.h> #define WORDLENGTH 30
#define NHASH 300 typedef struct node* nodeptr;
typedef struct node
{
char* word;
int cnt;
nodeptr next;
} node; int hash(char* buf) //其实,我没懂这里为什么是31
{
unsigned n=0;
char* p;
for(p=buf;*p;p++)
n=31*n+(*p);
return n%NHASH;
} nodeptr hashTable[NHASH]; //链表法,解决hash的冲突.
void incword(char* buf)
{
int n=hash(buf);
nodeptr p;
for(p=hashTable[n];p;p=p->next)
{
if(strcmp(p->word,buf)==0)
{
p->cnt++;
return;
}
}
p=(nodeptr)malloc(sizeof(node));
p->word=(char*)malloc(strlen(buf)+1);
strcpy(p->word,buf);
p->cnt=1;
p->next=hashTable[n];
hashTable[n]=p;
} int main ()
{
freopen("genetic.txt","r",stdin);
char buf[WORDLENGTH];
int i;
while( scanf("%s",buf)!=EOF )
incword(buf);
for(i=0;i<NHASH;i++)
{
nodeptr p=hashTable[i];
for(;p;p=p->next)
printf("%s %d\n",p->word,p->cnt);
}
return 0 ;
}

有好的字符串hash,欢迎告之。

字符串hash函数的更多相关文章

  1. 各种字符串Hash函数比较(转)

    常用的字符串Hash函数还有ELFHash,APHash等等,都是十分简单有效的方法.这些函数使用位运算使得每一个字符都对最后的函数值产生影响.另外还有以MD5和SHA1为代表的杂凑函数,这些函数几乎 ...

  2. 长度有限制的字符串hash函数

    长度有限制的字符串hash函数 DJBHash是一种非常流行的算法,俗称"Times33"算法.Times33的算法很简单,就是不断的乘33,原型如下 hash(i) = hash ...

  3. [转]各种字符串Hash函数比较

    转自:https://www.byvoid.com/zht/blog/string-hash-compare 常用的字符串Hash函数还有ELFHash,APHash等等,都是十分简单有效的方法.这些 ...

  4. 【转】各种字符串Hash函数比较

    常用的字符串Hash函数还有ELFHash,APHash等等,都是十分简单有效的方法.这些函数使用位运算使得每一个字符都对最后的函数值产生影响.另外还有以MD5和SHA1为代表的杂凑函数,这些函数几乎 ...

  5. [T]各种字符串Hash函数比较

    常用的字符串Hash函数还有ELFHash,APHash等等,都是十分简单有效的方法.这些函数使用位运算使得每一个字符都对最后的函数值产生影响.另外还有以MD5和SHA1为代表的杂凑函数,这些函数几乎 ...

  6. 各种字符串Hash函数比较

    常用的字符串Hash函数还有ELFHash,APHash等等,都是十分简单有效的方法.这些函数使用位运算使得每一个字符都对最后的函数值产生影响.另外还有以MD5和SHA1为代表的杂凑函数,这些函数几乎 ...

  7. 各种字符串Hash函数(转)

    /// @brief BKDR Hash Function /// @detail 本 算法由于在Brian Kernighan与Dennis Ritchie的<The C Programmin ...

  8. hadoop Partiton中的字符串Hash函数改进

    最近的MapReduce端的Partition根据map生成的Key来进行哈希,导致哈希出来的Reduce端处理任务数量非常不均匀,有些Reduce端处理的数据量非常小(几分钟就执行完成,而最后的pa ...

  9. 一些常用的字符串hash函数

    unsigned int RSHash(const std::string& str) { unsigned int b = 378551; unsigned int a = 63689; u ...

随机推荐

  1. C语言学习总结(一) 基本语法

    第一章--C语言的基本概念 丹尼斯 里奇 一.什么是C语言? 定义:是一个面向过程的计算机高级语言--不需要任何运行环境便能运行的程序语言: 发展:目前是C11      (K&R C—> ...

  2. arm-linux-gcc中对“inline”的处理

    C++对于关键字“inline”的处理大家都知道,C++编译器对于内敛函数就是把它当做一个宏展开.这样可能会增加程序的代码量,却可以减少程序入栈和出栈的此处,从而影响程序的执行速度.但是,C语言中扩展 ...

  3. ListToDataTable

    public static DataTable ToDataTable<T>(IEnumerable<T> collection)       {           var ...

  4. Word2003中如何使封面和目录中不插入页码

    Word2003中如何使封面和目录中不插入页码?? 转载自: http://blog.zzedu.net.cn/user1/zhaoweijie/archives/2010/187266.html   ...

  5. nutch2.2.1

    http://blog.csdn.net/leave00608/article/details/17442163 https://svn.apache.org/repos/asf/nutch/tags ...

  6. Python+django部署(一)

    之所以 写这篇文章的原因在于django环境的确轻松搭建,之前Ubuntu上安装了,的确很轻松,但是后期我才知道随便做个环境出来很容易到了后面很麻烦,污 染了系统里的python版本,导致系统pyth ...

  7. python学习之--自定义函数:

    Python之--自定义函数: 在Python中,定义一个函数要使用def语句,依次写出函数名.括号.括号中的参数和冒号:,然后,在缩进块中编写函数体,函数的返回值用return语句返回. 以下自定义 ...

  8. Android-x86虚拟机安装配置全攻略

    转自Android-x86虚拟机安装配置全攻略 注:这里安装从简,具体请参考虚拟机Vmware安装运行安卓4.0详细教程 Android-x86虚拟机安装配置网上有很多,但是全部说明白的确不多,希望这 ...

  9. Cloud Insight!StatsD 系监控产品新宠!

    年关将至,Cloud Insight 正式版悄然上线了.没有大张旗鼓的宣传,也没有热热闹闹的庆祝,只是一群人在上线前踏踏实实的优化了两周,然后发版,就是这样一件简单的事. 然而就是这样一个低调的产品, ...

  10. 转:在Eclipse中进行C/C++开发的配置方法(20140721最新版)

    http://blog.csdn.net/baimafujinji/article/details/38026421 Eclipse 是一个开放源代码的.基于Java的可扩展开发平台.就其本身而言,它 ...