33. 百度面试题:有一个很大很大的输入流,大到没有存储器可以将其存储下来,而且只输入一次,如何从这个输入 流中随机取得m个记录
2014-03-22 18:23
1376 查看
题目:
有一个很大很大的输入流,大到没有存储器可以将其存储下来,而且只输入一次,如何从这个输入
流中随机取得m个记录
分析:
这题在soso面试的时候也见过,当时没有答出来。
现在也每想出好的办法。
网上看到一种方法:每次输入一个记录时,随机产生一个0到1之间的随机数,
用这些随机数维护一个大小为m的堆。
但是这种方法是否是后面的输入的纪录被选取的概率要比前面要大,不太合适随即取的要求。
???后续完善。。。
继续完善,谢谢_chen_lin_ 提供的思路。
模拟数据流生成了1-1000000的整数序列,随机在里面抽取100个数。
实现如下:
输出结果:
rand m data:214081,42675,910277,156113,549744,324942,296182,219732,318989,104930,698642,350230,862258,91276,667257,259708,599704,654231,511576,995314,656139,747846,886097,866713,330504,242010,147976,327057,386808,117999,478944,293433,203708,584959,502002,90630,809846,359830,25989,110210,514453,63067,467666,454933,28548,458088,461703,667961,466615,434741,54051,704393,216666,880643,615583,439624,620417,603399,830626,697033,914745,326997,74834,77412,487891,314260,139194,225634,162485,335521,911982,801962,766891,154600,819794,856387,427236,604588,265978,526451,994597,337788,674932,23974,292355,483701,671288,148098,96424,838102,301385,823148,742111,614669,353253,794833,681198,596458,611455,959873,
有一个很大很大的输入流,大到没有存储器可以将其存储下来,而且只输入一次,如何从这个输入
流中随机取得m个记录
分析:
这题在soso面试的时候也见过,当时没有答出来。
现在也每想出好的办法。
网上看到一种方法:每次输入一个记录时,随机产生一个0到1之间的随机数,
用这些随机数维护一个大小为m的堆。
但是这种方法是否是后面的输入的纪录被选取的概率要比前面要大,不太合适随即取的要求。
???后续完善。。。
继续完善,谢谢_chen_lin_ 提供的思路。
模拟数据流生成了1-1000000的整数序列,随机在里面抽取100个数。
实现如下:
#include<iostream> #include<stdlib.h> #include<stdio.h> #include<string.h> using namespace std; #define m 100 #define max 1000000 int getdata(FILE* fp)//生成数据流的样本数据 { int i = 1; if(fp != NULL) { while(i< max) { char tmp[100]; memset(tmp, 0, 100); if(i == max -1) sprintf(tmp, "%d", i++); else sprintf(tmp, "%d,", i++); cout << tmp << endl; fwrite(tmp, strlen(tmp), 1, fp); } } return -1; } int main(int argc, char* argv[]) { /* //生产数据流的语句 模拟 FILE* fp = fopen("1.txt", "wb"); getdata(fp); fclose(fp);*/ int i = 0; int a[m]; string l = ""; while(getline(cin, l)) { const char* p1 = l.c_str(); const char* p2 = NULL; char tmp[100]; while(*p1 != '\0') { p2 = p1; while(*p2 != ',' && *p2 != '\0') p2 ++; memset(tmp, 0, 100); strncpy(tmp, p1, p2-p1); int k = atoi(tmp); if(i < m) a[i] = k; else { //rand algritem int l = rand()%(i+1); if(l < m) a[l] = k; } i ++; if(*p2 != '\0') p2 ++; p1 = p2; } } if(i > m) { i = 0; cout << "rand m data:"; while(i < m) cout << a[i++] << ","; cout << endl; } else cout << "have no stream" << endl; return 0; }
输出结果:
rand m data:214081,42675,910277,156113,549744,324942,296182,219732,318989,104930,698642,350230,862258,91276,667257,259708,599704,654231,511576,995314,656139,747846,886097,866713,330504,242010,147976,327057,386808,117999,478944,293433,203708,584959,502002,90630,809846,359830,25989,110210,514453,63067,467666,454933,28548,458088,461703,667961,466615,434741,54051,704393,216666,880643,615583,439624,620417,603399,830626,697033,914745,326997,74834,77412,487891,314260,139194,225634,162485,335521,911982,801962,766891,154600,819794,856387,427236,604588,265978,526451,994597,337788,674932,23974,292355,483701,671288,148098,96424,838102,301385,823148,742111,614669,353253,794833,681198,596458,611455,959873,
相关文章推荐
- 百度面试题:有一个很大很大的输入流,大到没有存储器可以将其存储下来,而且只输入一次,如何从 这个输入 流中随机取得 m 个记录。
- 给定一个输入数据流,这个输入流很大,你不能将他们完全放在内存中。如何才能从这个输入流中随机的选取1000个数?
- 谷歌面试题:给定一个数据流,其中包含无穷尽的搜索关键字(比如,人们在谷歌搜索时不断输入的关键字) 。如何才能从这个无穷尽的流中随机的选取 1000 个关键字?
- 编写一个程序读入一行输入,然后反向打印该行,您可以把输入存储在一个char数组中: 假定该行不超过255个字符。回忆一下,您可以使用具有%c说明符的scanf()从输入中一次 读入一个字符,而且当您按下回车键时会产生换行符(/n)
- 编写一个程序读入一行输入,然后反向打印该行,您可以把输入存储在一个char数组中: 假定该行不超过255个字符。回忆一下,您可以使用具有%c说明符的scanf()从输入中一次 读入一个字符,而且当您按
- 谷歌面试题:输入是两个整数数组,他们任意两个数的和又可以组成一个数组,求这个和中前k个数怎么做?
- 谷歌面试题:输入是两个整数数组,他们任意两个数的和又可以组成一个数组,求这个和中前k个数怎么做?
- 面试题:给定一个有序的数组,如果往该数组中存储一个元素,并保证这个数组还是有序的,那么元素的存储的角标位如何获取。
- 面试题--给40亿个不重复的,没有排过序,给一个无符号整数,如何判断这个数在这40亿个数中
- 例题:把一个超市购物的题做成函数。这个题做成函数没有必要,但可以了解输入参数,输出参数,返回值,函数体,还有结构体,ArryList集合,for循环算结果,以及集合里 .count的使用
- 有一个函数int getNum(),每运行一次可以从一个数组V[N]里面取出一个数,N未知,当数取完的时候,函数返回NULL。现在要求写一个函数int get(),这个函数运行一次可以从V[N]里随机
- 写一个函数int get(),这个函数运行一次可以从V[N]里随机取出一个数,而这个数必须是符合1/N平均分布的
- 开平方 如果没有计算器,我们如何求2的平方根? 可以先猜测一个数,比如1.5,然后用2除以这个数字。
- 阿里巴巴面试算法题:有一个函数int getNum(),每运行一次可以从一个数组V[N]里面取出一个数,N未知,当数取完的时候,函数返回NULL。现在要求写一个函数int get(),这个函数运行一次可以从V[N]里随机取出一个数,而这个数必须是符合1/N
- 开平方 如果没有计算器,我们如何求2的平方根? 可以先猜测一个数,比如1.5,然后用2除以这个数字。
- 今天看了一篇oracle tip,关于如何获得行锁时跳过已被锁的行,oracle8i的sql reference居然没有关于这个选项的介绍,特此记录下来。
- 谷歌面试题:输入是两个整数数组,他们任意两个数的和又可以组成一个数组,求这个和中前k个数怎么做?
- 一个自认为写得还可以的存储过程,就是没有注释,看起来有点乱。与ERP的BOM相关的
- 如何判断一个链表中是否有环(百度面试题)
- 腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?