您的位置：首页 > 其它

编辑文章 - 博客频道 - CSDN.NET

2017-06-09 16:52 218 查看

哈希表存储的基本思想是：以数据表中的每个记录的关键字k为自变量，通过一种函数H(k)计算出函数值。把这个值解释为一块连续存储空间（即数组空间）的单元地址（即下标），将该记录存储到这个单元中。在此称该函数H为哈希函数或散列函数。按这种方法建立的表称为哈希表或散列表。

构造好的哈希函数的方法，应能使冲突尽可能地少，因而应具有较好的随机性。这样可使一组关键字的散列地址均匀地分布在整个地址空间。根据关键字的结构和分布的不同，可构造出许多不同的哈希函数。

1．直接定址法

  H(k)=k+c  (c≥0)

2．除留余数法

H(k)=k％m

3．平方取中法

4．折叠法

5．数值分析法

假设哈希表的地址范围为0～m-l，当对给定的关键字k，由哈希函数H(k)算出的哈希地址为i（0≤i≤m-1）的位置上已存有记录，这种情况就是冲突现象。

    处理冲突就是为该关键字的记录找到另一个“空”的哈希地址。即通过一个新的哈希函数得到一个新的哈希地址。如果仍然发生冲突，则再求下一个，依次类推。直至新的哈希地址不再发生冲突为止。

常用的处理冲突的方法有开放地址法、链地址法两大类

1．开放定址法

   用开放定址法处理冲突就是当冲突发生时，形成一个地址序列。沿着这个序列逐个探测，直到找出一个“空”的开放地址。将发生冲突的关键字值存放到该地址中去。

   如 Hi=(H(k)+d（i）) % m,
i=1，2，…k   (k<m-1)

   其中H(k)为哈希函数，m为哈希表长，d为增量函数，d(i)=dl，d2…dn-l。

   增量序列的取法不同，可得到不同的开放地址处理冲突探测方法。

（1）线性探测法

    线性探测法是从发生冲突的地址（设为d）开始，依次探查d+l，d+2，…m-1（当达到表尾m-1时，又从0开始探查）等地址，直到找到一个空闲位置来存放冲突处的关键
字。

    若整个地址都找遍仍无空地址，则产生溢出。

    线性探查法的数学递推描述公式为：

           d0=H(k)

           di=(di-1+1)% m   (1≤i≤m-1)

（2）平方探查法

   设发生冲突的地址为d，则平方探查法的探查序列为：d+12，d+22，…直到找到一个空闲位置为止。

平方探查法的数学描述公式为：

      d0=H(k)

      di=(d0+i2)
% m (1≤i≤m-1)

2．链地址法

       用链地址法解决冲突的方法是：把所有关键字为同义词的记录存储在一个线性链表中，这个链表称为同义词链表。并将这些链表的表头指针放在数组中（下标从0到
m-1）。这类似于图中的邻接表和树中孩子链表的结构。

哈希法是利用关键字进行计算后直接求出存储地址的。当哈希函数能得到均匀的地址分布时，不需要进行任何比较就可以直接找到所要查的记录。但实际上不可能完全避免冲突，因此查找时还需要进行探测比较。

在哈希表中，虽然冲突很难避免，但发生冲突的可能性却有大有小。这主要与三个因素有关。

第一:与装填因子有关

第二:与所构造的哈希函数有关

第三:与解决冲突的哈希冲突函数有关

哈希表的题目，有一个共同点，那就是点的顺序不影响题目，但是

了解完了哈希表基本内容之后，我来推荐两道题目。

http://cqsyz.openjudge.cn/haixbiao/01/正方形

http://cqsyz.openjudge.cn/haixbiao/02/sumset

题目我就不复制过来了，看了这两个题目，很容易发现其中的共同点。就是已知给定数据中的两个过后，通过查找哈希表内是否有另外两个元素能使等式成立。

对于正方形一题，确定了一条边，就能找出整个正方形，当然，一条边可以对应两个正方形。通过一条边计算另外两个点的方法是什么呢？静下来思考一下，新的横坐标为横坐标之一加上纵坐标之差，同理，新的纵坐标等于原来纵坐标之一加上横坐标之差。如下。

int x1,x2,y1,y2,delx,dely;
delx=poi[i].x-poi[j].x;
dely=poi[i].y-poi[j].y;

第一组
x1=poi[i].x+dely; y1=poi[i].y-delx;
x2=poi[j].x+dely; y2=poi[j].y-delx;

第二组
x1=poi[i].x-dely; y1=poi[i].y+delx;
x2=poi[j].x-dely; y2=poi[j].y+delx;

此题如果不使用哈希表，判断另外两点是否存在只能用二维布尔数组，然后根据题目给我数据范围，20001，使用bool b[20001][20001]来判断，很遗憾，memset对于这么大的数组的负数坐标无能为力。b[-1][-1]=72。如此，考虑哈希表。

用哈希表的第一步是确定对什么数据进行哈希，很明显，这道题是bool数组，第二步是考虑如何哈希，这道题，我们想要的是二维变一维，并且尽可能的让哈希表填满，所以我采用让一维哈希表的坐标p=x*x+y*y来mo一个数，坐标确定了，那么值呢?注意了，哈希表的值只能等于一个数字，而判断的点确是一个坐标，如何建立其中的联系呢？让每一个点都有一个独特的值。于是可以x*10000+y，让x乘的数尽量大，保证唯一性。下面给出了建立哈希表的代码

void hash(int x,int y){
int position=(x*x+y*y)%30000;
long long zhi=x*100000+y;
while(1){
position+=position%31+1;
if(position>MAX) position%=MAX;
if(hashtable[position]==zhi) return;
if(hashtable[position]==0) break;
}hashtable[position]=zhi;

}

当手中有了哈希表，如何根据坐标来判断某点是否存在呢？我们拥有的这个哈希表需要达成的是bool效果，就把现在需要验证的坐标进行与建立时相同的运算，看这个坐标能否得到要的值。

int Find(int x,int y){
int position=(x*x+y*y)%30000;
long long zhi=x*100000+y;
while(1){
position+=position%31+1;
if(position>MAX) position%=MAX;
if(hashtable[position]==0) return 0;
else if(hashtable[position]==zhi) return 1;
}

}

分析完毕。

第二题sumset

首先找到a+b=d-c这个式子，意思是a,b的关系和d,c的关系对应，于是可以通过哈希表存储a+b的值，再两重循环枚举d,c如果哈希表里对应有值，就寻找最大的d

后面的过程和正方形几乎一样，不再分析。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航