您的位置:首页 > 其它

唯品会2018校招机器学习、算法笔试题

2018-01-27 16:26 387 查看

前言

剩下的题目都是关于图像的,一个是卷积神经网络是什么,卷积的意义?

还有一个是传统图像处理里面的sift提取是什么意思?

鉴于自己不是搞图像方面的,就没有详细写了。

个人答案,欢迎交流。

一.(深度学习方向)深度学习和过往的神经网络训练方法有什么区别?给出几个具体的loss function?

神经网络和深度学习的概念区别:

神经网络是我们经常看到的那种层级网络结构,它是指一种具体的模型。而深度学习是基于当神经网络层数增多,神经网络学习日益困难的问题而提出的一种学习的方式。

更加具体的解答请参见博客,这里面写的非常清楚。

以下是我基于上述博客做的一个简短的解答:

1.深度学习的目的?

 大多数情况下,我们面临的主要是一个分类问题或者是回归问题。但是基于已有的数据,我们很难提取一些有效的特征构建模型(传统机器学习基于经验),而深度学习则是设计了这样一套方案,能够让模型自己学习特征。

因此,“深度模型”是手段,“特征学习”是目的。

摘自上述博客。

As a result, Deep Learning is an unsupervised learning algorithm.

2.传统神经网络的训练方式?

 传统的神经网络训练方式正如大家所了解的那样,分为前向传播和反向传播。前向传播构建了神经网络层输出与层输入之间的复杂关系,而反向传播则是利用梯度下降方法,往回更新参数,使得目标函数(也即loss function)下降,最终趋于收敛,则训练完毕。

3.传统的神经网络训练方式有什么不好?

 梯度消失问题,也就是说若某一层的梯度非常小,则该层前面的梯度会更小(最终趋于0),也就是说很前面的层数的参数会趋于不更新。

博客中还讲了其他的一些缺点,该兴趣的可以自行查看。

4.深度学习训练方法?

 深度学习方法采用逐层训练的方法,参照博客中AutoEncoder可以很好的理解layer-wise。

其实感觉反向传播同神经网路是一样的,只是在前向传播时,是逐层训练,逐层调优。

5.一些loss function?(这部分不负责任的,还是请大家自行查阅)



AutoEncoder目标函数



Sparse Coding稀疏编码

二.(NLP方向)现在深度学习在nlp领域有哪些应用? 请具体说明

自行查阅。

知乎回答感觉就挺好的。

三. 什么是中文分词? 列举出几种你所知的分词方法

三大主流分词方法:基于词典的方法、基于规则的方法和基于统计的方法。

词典或规则:

基于已有词典 ,根据匹配类型不同而划分,有最大匹配法等。

统计:

1.组成词语的字可能多次同时出现的可能性最大而形成的N-gram模型

2.将词语构成看成是标注问题而出现的隐马尔科夫链、条件随机场等模型。

详情可参见博客

求问,求补充

N-gram和HMM、CRF的区别?

个人认为,N-gram是基于统计的,没有标注问题。

而HMM、CRF引入了一个中间变量(即状态)。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: