您的位置:首页 > 其它

问题描述如下: 有2.5亿个整数(这2.5亿个整数存储在一个数组里面,至于数组是放在外存还是内存,没有进一步具体说明); 要求找出这2.5亿个数字里面,不重复的数字的个数; 另外,可用的内存限定为600M; 要求算法尽量高效,最优;

2010-08-31 15:30 831 查看
问题描述如下:

有2.5亿个整数(这2.5亿个整数存储在一个数组里面,至于数组是放在外存还是内存,没有进一步具体说明);

要求找出这2.5亿个数字里面,不重复的数字的个数



另外,可用的内存限定为600M;

要求算法尽量高效,最优;

解决方案:

其实分两次算,先算<0部分再算>0部分

则每次统计的数的个数为2^31

以512的内存,每个数以2bit的空间就能存储足够的信息了

1,申请512M内存,作为一个数是否存在的标记flag,全清0

2,设置记数器 count,清0

3,读入一个数,如果>=0则查看相应flag:如果为0,flag置1,count加1;如果为1,flag置2,count减1;如果为2,不处理

4,重复3,直到所有整数处理完毕

5, 清除所有的flag(不清除count)

6,读入一个数,如果<0则查看相应flag:如果为0,flag置1,count加1;如果为1,flag置2,count减1;如果为2,不处理

4,重复6,直到所有整数处理完毕

嘿,同志们,俺就没搞清楚18楼的算法:

A:int的值域有4G之多,使用512M,那512M中的每个BYTE必需要能表示8个数字,而BYTE只能表示最多8位。

B:如果每BYTE中,需要2bit来表示一个数字的存储,则每BYTE只是4个数字,而512M只能是2G个数字,则对int的值域表示不完。

所以说我没看懂。请各位解答一下。

所以需要分大于0和小于0来进行计算,这样也是为了节省空间
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐