您的位置:首页 > 职场人生

数据挖掘/机器学习 之 面试总结

2016-04-11 22:09 375 查看
从过年到现在我找实习,先后面了:新浪微博,360,支付宝,百度地图,岗位都是关于数据挖掘和机器学习的,现在把面试经验总结如下:

简历的问题,要为每一个岗位做特定的简历,简历上和这个岗位无关的东西最好不要写或者少些,比如我去新浪微博面试,面试官上来就说我是搞通信的不懂机器学习啥的。。。当时还没有经验简历上无关的东西确实多。
由于机器学习中的模型算法特别的多,面试时面试官也不会全问,一般都会让你选一个自己最熟悉的算法来讲或者项目上他感兴趣的东西来问。所以在准备时有两个重点:1)挑一个自己最熟悉模型,提前记住它的原理,推导,使用场景和适用数据,参数调优,缺点,有什么方法可以增强等,还有最好是能手写一个简单的实现,能够用伪码写成分布式的形式(map-reduce实现)2)项目中的算法照1)中的深度来准备
如果上面的是深度,那我们还要有广度上的准备:尽量多了解一些算法,可以不深但是要知道点,因为面试官问完好多后一般都会问你还知道什么算法?这个时候他一般不会太问问题了,可能只是想了解下你知识的广度
提前了解下要面试的部门使用的什么算法居多,可以针对性的准备下
别紧张,和面试官注意沟通,尽量达到一种和面试官讨论的氛围
最好掌握两种语言:一种工程性的如C++,一种灵活度高的如Python
运气:这个也很关键,有的时候面试官心情好,问的不刁钻也愿意给你时间思考或者和你讨论,有的时候有些面试官计较着急可能就只给你一次机会,一旦表现不好可能就会赶你走了。
最关键的是提升自己的水平,多看书多实地操作,把每次面试的问题记下来,针对不足来学习

此外我们可能学习的算法比较多但是实际工业上应用的算法却比较固定,比较常见的是:随机深林,GBDT,以及线性/逻辑回归,或者聚类等,所以最好多了解点这些方向的(如果是自然语言处理或者深度学习的话我就不太懂了)
问我的问题主要集中在以下几个:

Kmeans原理,不足,代码,并行化
SVM原理
决策树原理
如何衡量相似性:(很开放的问题,这样的问题要注意和面试官沟通),我答的时候主要是针对不同的数据类型说的

数据结构和算法方向的问题:

我在面试时被问的不多,大多比较浅显和基础,但是最好准备下。而且如果是多人面的话,每个面试官会有不同的侧重点,如果有的问了机器学习的东西,其他人可能就要问数据结构和算法了。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: