西安尚学堂 练习09.03|Java编程笔试面试题
2019-09-03 17:02
991 查看
- 在2.5亿个整数中找出不重复的整数,内存不足以容纳这2.5亿个整数。
方案1:采用2-Bitmap(每个数分配2bit,00表示不存在,01表示出现一次,10表示多次,11无意义)进行,共需内存 内存,还可以接受。然后扫描这2.5亿个整数,查看Bitmap中相对应位,如果是00变01,01变10,10保持不变。所描完事后,查看bitmap,把对应位是01的整数输出即可。
方案2:也可采用上题类似的方法,进行划分小文件的方法。然后在小文件中找出不重复的整数,并排序。然后再进行归并,注意去除重复的元素。 - 海量数据分布在100台电脑中,想个办法高校统计出这批数据的TOP10。
在每台电脑上求出TOP10,可以采用包含10个元素的堆完成(TOP10小,用最大堆,TOP10大,用最小堆)。比如求TOP10大,我们首先取前 10个元素调整成最小堆,如果发现,然后扫描后面的数据,并与堆顶元素比较,如果比堆顶元素大,那么用该元素替换堆顶,然后再调整为最小堆。最后堆中的元 素就是TOP10大。
求出每台电脑上的TOP10后,然后把这100台电脑上的TOP10组合起来,共1000个数据,再利用上面类似的方法求出TOP10就可以了。 - 怎么在海量数据中找出重复次数最多的一个?
先做hash,然后求模映射为小文件,求出每个小文件中重复次数最多的一个,并记录重复次数。然后找出上一步求出的数据中重复次数最多的一个就是所求(具体参考上期IP那题)。 - 上千万或上亿数据(有重复),统计其中出现次数最多的钱N个数据。
上千万或上亿的数据,现在的机器的内存应该能存下。所以考虑采用hash_map/搜索二叉树/红黑树等来进行统计次数。然后就是取出前N个出现次数最多的数据了,可以用第2题提到的堆机制完成。 - 1000万字符串,其中有些是重复的,需要把重复的全部去掉,保留没有重复的字符串。请怎么设计和实现?
这题用trie树比较合适,hash_map也应该能行。 - 一个文本文件,大约有一万行,每行一个词,要求统计出其中最频繁出现的前10个词,请给出思想,给出时间复杂度分析。
这题是考虑时间效率。用trie树统计每个词出现的次数,时间复杂度是O(nle)(le表示单词的平准长度)。然后是找出出现最频繁的 前10个词,可以用堆来实现,前面的题中已经讲到了,时间复杂度是O(nlg10)。所以总的时间复杂度,是O(nle)与O(nlg10)中较大 的哪一个。
相关文章推荐
- Java笔试题库之编程题库 总共30道编程题,掌握了就可以应付中级以内Java面试题
- Java性能优化之编程技巧总结,java面试题,java中级笔试题
- 史上最全阿里 Java 面试题总结,Java面试题,BAT笔试
- JAVA--第六周实验--任务1--Java的对象封装编程练习
- Java基础练习题 考试题 笔试题 面试题 (1)
- Java 编程思想(第4版)学习笔记(迭代器 Iterator ListIterator 第11章练习11)
- 1051 : 补提交卡 hiho模拟面试题2 - google在线技术笔试模拟 By Java
- 最新java编程面试题
- 笔试面试题二:Java中交换两个变量的值,你能想到几种方法?
- java笔试面试题---基础部分3
- JAVA高级工程师笔试面试题
- java笔试题目(java面试题)
- Java面试题笔试题大全
- android 经典java笔试面试题很详细不看后悔!
- 牛客网-专业IT笔试面试备考平台,最全C++JAVA前端求职题库,全面提升IT编程能力
- java语言的科学与艺术-编程练习Hailstone
- JAVA编程练习:java输出九九乘法表
- Java笔试面试题003
- Java笔试面试题整理第三波