您的位置：首页 > 其它

唯品会2018校招机器学习、算法笔试题

2018-01-27 16:26 387 查看

前言

剩下的题目都是关于图像的，一个是卷积神经网络是什么，卷积的意义?

还有一个是传统图像处理里面的sift提取是什么意思?

鉴于自己不是搞图像方面的，就没有详细写了。

个人答案，欢迎交流。

一.（深度学习方向）深度学习和过往的神经网络训练方法有什么区别？给出几个具体的loss function？

神经网络和深度学习的概念区别：

神经网络是我们经常看到的那种层级网络结构，它是指一种具体的模型。而深度学习是基于当神经网络层数增多，神经网络学习日益困难的问题而提出的一种学习的方式。

更加具体的解答请参见博客，这里面写的非常清楚。

以下是我基于上述博客做的一个简短的解答：

1.深度学习的目的？

大多数情况下，我们面临的主要是一个分类问题或者是回归问题。但是基于已有的数据，我们很难提取一些有效的特征构建模型（传统机器学习基于经验），而深度学习则是设计了这样一套方案，能够让模型自己学习特征。

因此，“深度模型”是手段，“特征学习”是目的。

摘自上述博客。

As a result, Deep Learning is an unsupervised learning algorithm.

2.传统神经网络的训练方式？

传统的神经网络训练方式正如大家所了解的那样，分为前向传播和反向传播。前向传播构建了神经网络层输出与层输入之间的复杂关系，而反向传播则是利用梯度下降方法，往回更新参数，使得目标函数（也即loss function）下降，最终趋于收敛，则训练完毕。

3.传统的神经网络训练方式有什么不好？

梯度消失问题，也就是说若某一层的梯度非常小，则该层前面的梯度会更小（最终趋于0），也就是说很前面的层数的参数会趋于不更新。

博客中还讲了其他的一些缺点，该兴趣的可以自行查看。

4.深度学习训练方法？

深度学习方法采用逐层训练的方法，参照博客中AutoEncoder可以很好的理解layer-wise。

其实感觉反向传播同神经网路是一样的，只是在前向传播时，是逐层训练，逐层调优。

5.一些loss function？(这部分不负责任的，还是请大家自行查阅)

AutoEncoder目标函数

Sparse Coding稀疏编码

二.（NLP方向）现在深度学习在nlp领域有哪些应用？请具体说明

自行查阅。

知乎回答感觉就挺好的。

三. 什么是中文分词？列举出几种你所知的分词方法

三大主流分词方法：基于词典的方法、基于规则的方法和基于统计的方法。

词典或规则：

基于已有词典，根据匹配类型不同而划分，有最大匹配法等。

统计：

1.组成词语的字可能多次同时出现的可能性最大而形成的N-gram模型

2.将词语构成看成是标注问题而出现的隐马尔科夫链、条件随机场等模型。

详情可参见博客。

求问，求补充

N-gram和HMM、CRF的区别？

个人认为，N-gram是基于统计的，没有标注问题。

而HMM、CRF引入了一个中间变量（即状态）。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航