一系列笔面试题
2012-05-14 00:00
253 查看
1、struts2的核心机制(拦截器方面)
2、http协议(get、post)
3、数据库建模
4、Singleton模式
5、足球比赛,循环赛,ABCD四个队,最少拿多少分可以晋级(前两名晋级,赢球得3分,平得1分,输不得分)
6、网络热门词汇统计,trie树问题。或者topK问题。(hashtable和最小堆)
-------------------------------------------------------------------------------------------
1、给一个单词a,如果通过交换单词中字母的顺序可以得到另外的单词b,那么b是a的兄弟单词,比如的单词army和mary互为兄弟单词。
现在要给出一种解决方案,对于用户输入的单词,根据给定的字典找出输入单词有哪些兄弟单词。请具体说明数据结构和查询流程,要求时间和空间效率尽可能地高。
2、C和C++中如何动态分配和释放内存?他们的区别是什么?
3、线程和进程的区别及联系?如何理解“线程安全”问题?
4、数组al[0,mid-1]和al[mid,num-1]是各自有序的,对数组al[0,num-1]的两个子有序段进行merge,得到al[0,num-1]整体有序。要求空间复杂度为O(1)。注:al[i]元素是支持'<'运算符的。
5、网页爬虫在抓取网页时,从指定的URL站点入口开始爬取这个站点上的所有URL link,抓取到下一级link对应的页面后,同样对页面上的link进行抓取从而完成深度遍历。为简化问题,我们假设每个页面上至多只有一个link,如从www.baidu.com/a.html链接到
www.baidu.com/b.html再链到www.baidu.com/x.html,当爬虫抓取到某个页面时,有可能再链回www.baidu.com/b.html,也有可能爬取到一个不带任何link的终极页面。当抓取到相同的URL或不包含任何link的终极页面时即完成爬取。爬虫在抓取到这些页面后建立一个单向链表,用来记录抓取到的页面,如:a.html->b.html->x.html...->NULL。
问:对于爬虫分别从www.baidu.com/x1.html和www.baidu.com/x2.html两个入口开始获得两个单向链表,得到这两个单向链表后,如何判断他们是否抓取到了相同的URL?(假设页面URL上百亿,存储资源有限,无法用hash方法判断是否包含相同的URL)
请先描述相应的算法,再给出相应的代码实现。(只需给出判断方法代码,无需爬虫代码)
6、相信大家都使用过百度搜索框的suggestion功能,百度搜索框中的suggestion提示功能如何实现?请给出实现思路和主要的数据结构、算法。有什么优化思路可以使得时间和空间效率最高?
2、http协议(get、post)
3、数据库建模
4、Singleton模式
5、足球比赛,循环赛,ABCD四个队,最少拿多少分可以晋级(前两名晋级,赢球得3分,平得1分,输不得分)
6、网络热门词汇统计,trie树问题。或者topK问题。(hashtable和最小堆)
-------------------------------------------------------------------------------------------
1、给一个单词a,如果通过交换单词中字母的顺序可以得到另外的单词b,那么b是a的兄弟单词,比如的单词army和mary互为兄弟单词。
现在要给出一种解决方案,对于用户输入的单词,根据给定的字典找出输入单词有哪些兄弟单词。请具体说明数据结构和查询流程,要求时间和空间效率尽可能地高。
2、C和C++中如何动态分配和释放内存?他们的区别是什么?
3、线程和进程的区别及联系?如何理解“线程安全”问题?
4、数组al[0,mid-1]和al[mid,num-1]是各自有序的,对数组al[0,num-1]的两个子有序段进行merge,得到al[0,num-1]整体有序。要求空间复杂度为O(1)。注:al[i]元素是支持'<'运算符的。
5、网页爬虫在抓取网页时,从指定的URL站点入口开始爬取这个站点上的所有URL link,抓取到下一级link对应的页面后,同样对页面上的link进行抓取从而完成深度遍历。为简化问题,我们假设每个页面上至多只有一个link,如从www.baidu.com/a.html链接到
www.baidu.com/b.html再链到www.baidu.com/x.html,当爬虫抓取到某个页面时,有可能再链回www.baidu.com/b.html,也有可能爬取到一个不带任何link的终极页面。当抓取到相同的URL或不包含任何link的终极页面时即完成爬取。爬虫在抓取到这些页面后建立一个单向链表,用来记录抓取到的页面,如:a.html->b.html->x.html...->NULL。
问:对于爬虫分别从www.baidu.com/x1.html和www.baidu.com/x2.html两个入口开始获得两个单向链表,得到这两个单向链表后,如何判断他们是否抓取到了相同的URL?(假设页面URL上百亿,存储资源有限,无法用hash方法判断是否包含相同的URL)
请先描述相应的算法,再给出相应的代码实现。(只需给出判断方法代码,无需爬虫代码)
6、相信大家都使用过百度搜索框的suggestion功能,百度搜索框中的suggestion提示功能如何实现?请给出实现思路和主要的数据结构、算法。有什么优化思路可以使得时间和空间效率最高?
相关文章推荐
- [收藏]网上搜集的一系列C#面试题(持续更新……)
- 整理的一系列面试经历和面试题
- 一道面试题关于Integer的缓存范围(-128~127)所引起的一系列问题记录
- 一系列面试题
- GPS系统研发人员面试题(VC通讯)
- 公考面试题82题
- 【面试题】在二元树中找出和为某一值的所有路径
- [各种面试题] 两个排序数组的中位数
- Java面试题总结(二)
- 【剑指Offer学习】【面试题3 :二维数组中的查找】
- leetcode-54 Spiral Matrix 顺时针打印矩阵(《剑指offer》面试题20)
- Java公司面试题集锦(一)
- 面试题总汇
- 面试题40—数组只出现一次的数字
- 各大公司Java后端开发面试题
- 软件工程师(ASP.NET)面试题
- SQL经典面试题及答案1
- 国内顶级IT公司面试题
- 面试题47 不用+-*/ 做加法
- 《剑指offer》面试题23 从上往下打印二叉树