您的位置：首页 > 其它

Hash函数--除留余数法--开放定址法--线性探测再散列

2018-03-31 13:55 369 查看

Hash函数计算--常用方法之
--除留余数法：
假设哈希表长为m，p为小于等于m的最大素数，则哈希函数为h（k）=k % p ，其中%为模p取余运算。例如，已知待散列元素为（18，75，60，43，54，90，46），表长m=10，p=7，则有 h(18)=18 % 7=4 h(75)=75 % 7=5 h(60)=60 % 7=4 h(43)=43 % 7=1 h(54)=54 % 7=5 h(90)=90 % 7=6 h(46)=46 % 7=4此时冲突较多。为减少冲突，可取较大的m值和p值，如m=p=13，结果如下： h(18)=18 % 13=5 h(75)=75 % 13=10 h(60)=60 % 13=8 h(43)=43 % 13=4 h(54)=54 % 13=2 h(90)=90 % 13=12 h(46)=46 % 13=7此时没有冲突，如图所示。 0 1 2 3 4 5 6 7 8 9 10 11 12
[align=center]

[/align]   理论研究表明，除留余数法的模p取不大于表长且最接近表长m素数时效果最好，且p最好取1.1n～1.7n之间的一个素数（n为存在的数据元素个数）

冲突解决：
1、开放定址法这种方法也称再散列法，其基本思想是：当关键字key的哈希地址p=H（key）出现冲突时，以p为基础，产生另一个哈希地址p1，如果p1仍然冲突，再以p为基础，产生另一个哈希地址p2，…，直到找出一个不冲突的哈希地址pi ；将相应元素存入其中。这种方法有一个通用的再散列函数形式：          Hi=（H（key）+di）% m   i=1，2，…，n    其中H（key）为哈希函数，m 为表长，di称为增量序列。增量序列的取值方式不同，相应的再散列方式也不同。主要有以下三种： 1>   线性探测再散列(常用)    dii=1，2，3，…，m-1这种方法的特点是：冲突发生时，顺序查看表中下一单元，直到找出一个空单元或查遍全表。 2> 二次探测再散列    di=12，-12，22，-22，…，k2，-k2    ( k<=m/2 )    这种方法的特点是：冲突发生时，在表的左右进行跳跃式探测，比较灵活。   3>伪随机探测再散列    di=伪随机数序列。具体实现时，应建立一个伪随机数发生器，（如i=(i+p) % m），并给定一个随机数做起点。

2、 再哈希法    这种方法是同时构造多个不同的哈希函数；
3、链地址法    这种方法的基本思想是将所有哈希地址为i的元素构成一个称为同义词链的单链表，并将单链表的头指针存在哈希表的第i个单元中，因而查找、插入和删除主要在同义词链中进行。链地址法适用于经常进行插入和删除的情况。
4、建立公共溢出区这种方法的基本思想是：将哈希表分为基本表和溢出表两部分，凡是和基本表发生冲突的元素，一律填入溢出表

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： hash

相关文章推荐

新的分享

章节导航