您的位置:首页 > 编程语言 > C语言/C++

用C++实现bitmap

2016-03-16 22:10 696 查看

位图数据结构

  该数据结构描述了一个有限定义域内的稠密集合,其中的每一个元素最多出现一次并且没有其他任何数据与该元素相关联。即使这些条件没有完全满足(例如,存在重复元素或额外的数据),也可以用有限定义域内的键作为一个表项更复杂的表格索引。

1.什么是bitmap?

  所谓的Bit-map就是用一个bit位来标记某个元素对应的Value, 而Key即是该元素。由于采用了Bit为单位来存储数据,因此在存储空间方面,可以大大节省。

2.举个例子

   如果说了这么多还没明白什么是Bit-map,那么我们来看一个具体的例子,假设我们要对0-7内的5个元素(4,7,2,5,3)排序(这里假设这些元素没有重复)。那么我们就可以采用Bit-map的方法来达到排序的目的。要表示8个数,我们就只需要8个Bit(1Bytes),首先我们开辟1Byte的空间,将这些空间的所有Bit位都置为0,如下图:



   然后遍历这5个元素,首先第一个元素是4,那么就把4对应的位置为1(可以这样操作 p+(i/8)|(0×01<<(i%8)) 当然了这里的操作涉及到Big-ending和Little-ending的情况,这里默认为Big-ending),因为是从零开始的,所以要把第五位置为1,如下图:



  然后再处理第二个元素7,将第八位置为1,,接着再处理第三个元素,一直到最后处理完所有的元素,将相应的位置为1,这时候的内存的Bit位的状态如下:



  然后我们现在遍历一遍Bit区域,将该位是一的位的编号输出(2,3,4,5,7),这样就达到了排序的目的。下面的代码给出了一个BitMap的用法:排序。

位图的操作

  在C/C++中int类型有4个字节,也就是32位。当我们有1000万条不同数据时,我们只需要1000万个位来表示,也就是10000000/(8*1024*1024)MB,大约为1.25MB。

  我们可以用一个unsigned int类型的数组或者向量来表示位图,假设我们定义vector<unsigned int> a,则 第i位可表示为a[i/32]的i%32位(其中,32*N+r = i,r为i%32,也就是i/32的余数)。

  由于计算机对位的操作比乘除法更有效率,这里计算i/32可以用位移操作:i>>5;计算i%32可以用1&31(大家可以自己尝试一下)。

1.set

  将位图中的第i位设置为1,即把a[i/32]的第(i%32)位设置为1。定义pos = 1<<31,表示32位中的第一位为1,其余位为0,将pos右移(i%32)位即能将相应bit置为1。

a[i>>5] |= (pos>>( i & 31))


2.get

  判断位图的第i位是否为1

return a[i>>5] & (pos>>(i & 31));


  得到的值大于0 ,则说明该位值为1,否则为0。

3.clear

  将位图中的第i位设置为0

a[i>>shift] &= ~(pos>>(i & mask));


4.实现代码

#include<iostream>
#include<vector>
using namespace std;

class BitMap {
public:
BitMap(int num):n(num),mask(0x1F),shift(5),pos(1<<mask),a(1+n/32,0){}
void set(int i) {
a[i>>shift] |= (pos>>(i & mask));
}
int get(int i) {
return a[i>>shift] & (pos>>(i & mask));
}
void clr(int i) {
a[i>>shift] &= ~(pos>>(i & mask));
}
private:
int n;
const int mask;
const int shift;
const unsigned int pos;
vector<unsigned int> a;
};

int main() {
BitMap bitmap(100);
bitmap.set(27);
bitmap.set(29);
bitmap.set(131);
int res = bitmap.get(27);
cout<<res<<endl;
return 0;
}


参考资料

1. 《编程珠玑》第1章 习题2

2. 海量数据处理面试题集锦
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  位图 bitmap