您的位置:首页 > 职场人生

机器学习图像识别数据挖掘面试中 不会的&答错的&答得不好的 问题Mark1

2017-04-29 17:35 393 查看
博主非CS传统工科硕士一枚,硕士期间项目上和深度学习沾沾边。目前投的岗位差不多都是图像识别或者机器学习或者数据挖掘方向,几个面试下来,差不多都是没有下文了,怪不得被人只恨自己没有准备充分,在这里记录一下面试中遇到的问题和面完之后自己查阅相关资料后的解决办法,以及引伸相似的可能会被问到的问题。希望大家都能找到心仪的实习和工作O(∩_∩)O

欢迎补充和指正!转载请注明出处。

1Q: 如何判断单链表是否有环?

神马事有环的单链表。。。长这样:



A1:设定两个指针p, q,其中p每次向前移动一步,q每次向前移动两步。那么如果单链表存在环,则p和q相遇;否则q将首先遇到null。

Why:只要两个指针进入环后,快指针的总会成功把慢指针套圈。

证明:设环长为L,两个指针都进入环后,快指针比慢指针逆时针位置提前N(N=慢指针已走长度%L)步,由于N小于L,在环中也可看成,慢指针位置上比快指针提前(L-N)步,由于快指针比慢指针速度快1,则(L-N)步后,两指针必定会相遇。

ext_Q1: 求环的长度

从第一次相遇到第二次相遇,慢指针走过的路程长则为L

ext_Q2: 如何找到环的入口?

第一次相遇时,slow走的长度 S = LenA + x;

第一次相遇时,fast走的长度 2S = LenA + n*L + x;

所以可以知道,LenA + x = n*L;  LenA = n*L -x;

所以可以在第一相遇的点和头结点出设两个指针,同步出发,相遇的点即为环的入口。

ext_Q3: 求链表的长度?

起点到环入口长度加环长

ext_Q4: 如果判断两个单链表有交?第一个交点在哪里?

把两个链表尾相连可组成一个有环的链表,确定环的入后。

这个博客汇总了链表的常考题型:

http://blog.csdn.net/a45872055555/article/details/20947187

数据结构还是要好好啃!!!!花样繁多

2Q: 什么是SIFT算法?如何比较两幅图像的相似度

A2: Scale-invariant feature transform, 尺度不变特征变换。它在不同尺度空间上寻找极值点,获得其局部性特征,其特征具有位置、尺度、旋转不变性。

匹配方法:关键点描述子的欧式距离来作为两幅图像的关键点的相似性度量。如果最近距离除以次近距离小于某个阈值,则判定为一对匹配点。

3Q: 随机森林的随机性体现在哪?

A3:利用多个决策树取预测预测结果的众数作为最后的分类结果。

数据的随机性选取

通过从原始的数据集中采取有放回抽样,构造子数据集,子数据集的数据量是和原始数据集相同。不同子数据集的元素可以重复,同一个子数据集中的元素也可以重复。利用子数据集来构建子决策树。

待选特征的随机选取。

随机森林中的子树的每一个分裂过程并未用到所有的待选特征,而是从所有的待选特征中随机选取一定的特征,之后再在随机选取的特征中选取最优的分裂特征分裂。

4Q:现有的流行的网络及其特点?

A4:对于这个问题我打算之后再做一个详细的汇总

1.AlexNet 包括五层卷积层和三层全连接层,其中一个完整的卷积层可能包括一层convolution,一层Rectified Linear Units,一层max-pooling,一层normalization。

2. vgg 使用了更多的卷积层,严格使用3×3卷积,步长和padding都为1,还有2×2的步长为2的maxpooling层。

3. GoogLenet 大大加深了网络的层数,Inception Module采用不同尺度的卷积核。去掉了最后的full-connected layer,用globalpooling代替大大减小了参数。

4. Resnet 引入了残差模块,解决了层次比较深的时候无法训练的问题(由于网络太深会导致梯度弥散/爆炸无法收敛)。

5Q:Keras 中切换backen的方法,keras是怎么做到支持theano和tensorflow?

A5:修改~/.keras/keras.json的backen。

6Q:Keras中fit_generator的用法和核心?

由于默认情况下使用fit函数通常会把数据一次性load到GPU,造成gpu的负荷过大或者显存不足,所以使用fit_generator可实现分批load batch。而使用fit_generator则需要定义generator生成“批”,可使用python 里带的yelid函数断点生成输出。keras也支持随机augmentation训练的数据。

Reference

回答的参考链接如下:

A1: 链表问题

http://www.cnblogs.com/zhyg6516/archive/2011/03/29/1998831.html

http://blog.sina.com.cn/s/blog_725dd1010100tqwp.html

http://www.cnblogs.com/cyttina/archive/2012/10/28/2743760.html

http://www.cnblogs.com/xudong-bupt/p/3667729.html

http://blog.csdn.net/a45872055555/article/details/20947187

A2:SIFT算法介绍

http://blog.csdn.net/abcjennifer/article/details/7639681/

http://www.cnblogs.com/cfantaisie/archive/2011/06/14/2080917.html

http://baike.baidu.com/link?url=4iTLuR5T6HIs7p4zs38vXdbr0JxfVyDwirASqYD7ThKPsS5XJRWjvE3Cs0Q216_LlDFnVGeXZj43DQGoLx1Sq_

http://blog.csdn.net/zddblog/article/details/7521424

A3:随机森林

http://baike.baidu.com/link?url=1M9A8EtQpz0kSPRrXhqf_djcb0UsYX16Pm1gGuYkc5cIhdFIM589Io0MkyomqPrl-k0vnCNoHsAFXe9K9HXGRWZiChLPlmknGmx-SGzFz7xRldqaOw618w4FGVhaSUPl

A4:卷积神经网络模型

https://www.zhihu.com/question/43370067

https://baijiahao.baidu.com/po/feed/share?wfr=spider&for=pc&context=%7B%22sourceFrom%22%3A%22bjh%22%2C%22nid%22%3A%22news_2969576425485733724%22%7D

A6:GPU的合理使用

https://zhuanlan.zhihu.com/p/23250782
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
相关文章推荐