您的位置:首页 > 其它

数据挖掘实习面经

2016-05-16 14:59 288 查看
春季实习招聘告一段落,写点面经还是有帮助的。

内推过很多公司,面试过很多公司,在拉勾上也投过很多公司。开始还是有点盲目的。笔试过网易,京东,微软,蘑菇街,360,腾讯,结果是几乎全挂。但是没关系,这没有影响我最后拿到腾讯的offer。

春季实习之前

天池大数据

预测用户和商品购买的可能性。

威视创建兼职实习

人脸图像的性别识别与年龄估计算法研究。

微知著才库

阿里巴巴算法工程师实习生

-阿里妈妈事业群(跪)

年前技术一面(60min)

年前快放假的时候,和几个同学在一起打升级,面试官在我打升级的时候突然打电话来面试,结果我在寒风中冻了一个小时完成了面试(为什么之前不约一下时间)。当时还是有点措手不及的,也没有考虑到会有面试,没有做太多准备,结果是一团糟。

问到的机器学习的算法有LR、SVM、RF、决策树,各个的主要思想、优缺点和使用场景,有没有自己写过实现过等等。然后就是Linux系统是否熟悉,Hadoop之前用过没有,Mapreduce是否了解怎么使用,数据结构中树的运用,C++标准模板库中Map是否熟悉等等。再者是线性模型和非线性模型方法的了解,最后是一道智力题:给定数组求第 kk 大的数。考查的就是很出名的线性时间选择算法,可惜当时没有了解过,答得不好。

年前技术二面(15min)

寒假在家午休,突然打电话过来面试(阿里的面试官就不能提前约时间吗)。主要考查代码能力,海量数据的匹配、搜索、查找问题。最后让我加强实践能力并且关注明年的春季实习生招聘。

-2016年阿里春季实习生招聘开始,就被年前面试我的面试官内推了,很快就接到了电话面试。

春季技术一面(40min)

这个之前约了电话面试的时间,有了充分的准备。首先,让我谈了一下我在人脸识别项目中的主要工作和算法思想,当他知道我二分类所用的分类器是SVM之后,深入问我SVM的原理及核思想等式。接下来,让我讲一下在去年的天池比赛,我是怎么做的,效果怎么样等等。一顿吹侃之后,让我设计一个广告推荐系统,假设某一个用户上线了,把给定的广告按此用户排序,推荐给他。最后,考查分布式框架下Mapreduce的思想,如何从海量的手机号码中统计各个号码的频率。

春季技术二面(30min)

一面一周之后接到二面的电话。首先,还是人脸识别的项目介绍,然后他说你是数学专业的问你一道智力题:有三种颜色的球,每种颜色球的数量不限,从中选取三个球,有多少种组合。最后推广到 mm 种颜色取 nn 个球,有多少种组合。不需要数学公式,给出模型求解,怎么写程序实现。最后估计这题没有回答好,跪了阿里。

大众点评数据挖掘/算法实习生

-广告技术平台数据罗盘组(通过)

部门直招只有一面(20min)

自我介绍之后,简述我在Coursera上学的吴恩达的机器学习课程的收获有哪些;最后,说一下快速排序的思想,EM算法,R和Python的使用。

新浪微博算法实习生

-广告部门(通过)

部门直招只有一面(30min)

自我介绍,人脸识别项目的介绍,其中具体问了流行学习和特征选择。看重数学建模经历。

普林科技数据挖掘实习生

-创业公司(通过)

技术一面(50min)

自我介绍之后,吴恩达的机器学习课程讲的怎么样,调一段说一下,然后就是有没有自己写过相关的代码实现相关的机器学习算法。再者就是之前做过的人脸识别的项目,细问了评价标准,包括:精确度,准确率,召回率,F1值,ROC曲线。怎么做特征选择,引出了Lasso和岭回归。对Adaboost和随机森林的理解并比较异同。Python和R在数据挖掘中的比较。SVM中超参数 CC 和学习率 α\alpha 的重要性和调优方法。

技术二面(20min)

关注我的美赛经历,大致问了一下。然后,介绍之前人脸项目的工作,详述SVM的思想原理,介绍研究生数学建模,我做的是拿到题,怎么做的等等,还说电面之后给我两天的时间写一份关于BP神经网络的学习文档发到指定邮箱。这是我见过的最有意思的面试题了。

微软(苏州)机器学习/数据挖掘/算法实习生

-工程技术部(跪)

技术一面(80min)

自我介绍之后,说几个生活中递归的例子。接下来是三个智力题:

杨辉三角,怎么编程给出第 nn 行的所有数字。坑爹的是不能用二项展开公式,并写代码实现。

IP地址的限制问题。

链表有环的检测,寻找环的入口,写代码实现。

腾讯基础研究实习生

-TEG自然语言处理中心(通过)

技术一面(50min)

首先自我介绍,询问了简历上人脸识别的项目,一顿吹嘘之后,了解到我是用过PCA技术降维的,就让我详述其原理和方法(此处有坑),最后来了三道智力题(有点hold不住)。

1. 现有1G的大整数数据,但是只给1M的内存,这样进行排序,保证可行的情况下,尽量最快。

2. 给定一个整数数组,求一段连续子空间,使得此区间的整数之和最大。

3. 怎么判断两个文档的相似性,怎么判断两个词的相似性。

HR面(13min)

大至谈人生、聊理想,小至说家庭、问妹子。诚实就好。

技术二面(16min)

聊我论文做的粒计算,发表论文的情况等,介绍一下自己曾经做的有意思的项目。这个我擅长(侃大山就行了)。

总结

关于基础的准备

做好基础的准备,常用算法和数据结构要了解知道,最好实现过;常用机器学习算法理论大致知道,最好有几个比较拿手的算法;找例子实现分析效果,做做比较分析,以及在分布式下怎么使用等等。最好学习文档就是官网的了。

关于简历投递

官网投递->笔试->面试

各种QQ群、微信群->内推->面试

一次失败不要放弃,有人没去,你就还有机会,关注部门直招。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: