您的位置:首页 > 其它

字符串HASH 学习总结 && 模板

2017-04-13 09:21 411 查看
一、字符串HASH模板 取自挑战程序设计竞赛(第2版)

</pre><pre code_snippet_id="446698" snippet_file_name="blog_20140809_1_9461278" name="code" class="cpp">/*===================================================*\
从b串中寻找和a串长度同样的子串,返回開始位置
不保证绝对正确,发生冲突概率为O(sqrt(n)),
n为哈希函数的最大值
\*===================================================*/

#define ull unsigned long long
const ull B = 1e8+7;    /*according to the book*/
const int MAXN = 1001;
char a[MAXN],b[MAXN];

int HashFind()/*返回匹配位置的開始处的下标,-1表示没有匹配*/
{
int al=strlen(a),bl=strlen(b);
if(al>bl)return -1;
ull t=1,ah=0,bh=0;
for(int i=0;i<al;i++)
{
t*=B;
ah=ah*B+a[i];
bh=bh*B+b[i];
}
for(int i=0;i+al<=bl;i++)
{
if(ah == bh)return i;
if(i+al < bl)bh=bh*B+b[i+al]-b[i]*t;
}
return -1;
}

/*===================================================*\
滚动哈希--滚动通过ull的溢出实现,相当于mod 2^64

\*===================================================*/

#define ull unsigned long long
const int MAXN = 1001;
const ull B = 1e8+7;    /*according to the book*/
char a[MAXN],b[MAXN];

int OverLap()/*a的后缀和b的前缀相等的最大长度*/
{
int al=strlen(a),bl=strlen(b),ans=0;
int minlen=min(al,bl);
ull t=1,ah=0,bh=0;
for(int i=1;i<minlen;i++)
{
ah=ah+a[al-i]*t;
bh=bh*B+b[i-1];
if(ah == bh)ans=i;
t*=B;
}
return ans;
}


二、字符串HASH的求法:(注意我不同颜色标记的地方,假设WA,一定看看那里是不是写对了)

1、直接ah[i]=ah[i-1]*base+a[i],那么长度为len的哈希值就是ah[i]-ah[i-len]*base[len] 此处ah[i]表示长为i字符串的哈希值

北京邀请赛的题,为了能做到在O(1)时间内算出hash值---比方算从l到r这段字符串的hash值,能够直接ah[r]-ah[l-1](当然须要推断l>=1,或者直接字符串从下标为1開始)。便于进行二分,就是这么写的
http://blog.csdn.net/u011026968/article/details/38473707
2、逐步递推:hash[i]=hash[i-1]*base+a[i]-a[i-len]*base[len] 再写字符矩阵匹配的时候两种写法我弄混了...o(╯□╰)o

三、HASH的其它构造方法:

1、假设限定了字符数目,能够映射为对应进制的数,如http://blog.csdn.net/u011026968/article/details/38490653
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: