唯品会2018校招机器学习、算法笔试题
2018-01-27 16:26
387 查看
前言
剩下的题目都是关于图像的,一个是卷积神经网络是什么,卷积的意义?还有一个是传统图像处理里面的sift提取是什么意思?
鉴于自己不是搞图像方面的,就没有详细写了。
个人答案,欢迎交流。
一.(深度学习方向)深度学习和过往的神经网络训练方法有什么区别?给出几个具体的loss function?
神经网络和深度学习的概念区别:
神经网络是我们经常看到的那种层级网络结构,它是指一种具体的模型。而深度学习是基于当神经网络层数增多,神经网络学习日益困难的问题而提出的一种学习的方式。
更加具体的解答请参见博客,这里面写的非常清楚。
以下是我基于上述博客做的一个简短的解答:
1.深度学习的目的?
大多数情况下,我们面临的主要是一个分类问题或者是回归问题。但是基于已有的数据,我们很难提取一些有效的特征构建模型(传统机器学习基于经验),而深度学习则是设计了这样一套方案,能够让模型自己学习特征。
因此,“深度模型”是手段,“特征学习”是目的。
摘自上述博客。
As a result, Deep Learning is an unsupervised learning algorithm.
2.传统神经网络的训练方式?
传统的神经网络训练方式正如大家所了解的那样,分为前向传播和反向传播。前向传播构建了神经网络层输出与层输入之间的复杂关系,而反向传播则是利用梯度下降方法,往回更新参数,使得目标函数(也即loss function)下降,最终趋于收敛,则训练完毕。
3.传统的神经网络训练方式有什么不好?
梯度消失问题,也就是说若某一层的梯度非常小,则该层前面的梯度会更小(最终趋于0),也就是说很前面的层数的参数会趋于不更新。
博客中还讲了其他的一些缺点,该兴趣的可以自行查看。
4.深度学习训练方法?
深度学习方法采用逐层训练的方法,参照博客中AutoEncoder可以很好的理解layer-wise。
其实感觉反向传播同神经网路是一样的,只是在前向传播时,是逐层训练,逐层调优。
5.一些loss function?(这部分不负责任的,还是请大家自行查阅)
AutoEncoder目标函数
Sparse Coding稀疏编码
二.(NLP方向)现在深度学习在nlp领域有哪些应用? 请具体说明
自行查阅。
知乎回答感觉就挺好的。
三. 什么是中文分词? 列举出几种你所知的分词方法
三大主流分词方法:基于词典的方法、基于规则的方法和基于统计的方法。
词典或规则:
基于已有词典 ,根据匹配类型不同而划分,有最大匹配法等。
统计:
1.组成词语的字可能多次同时出现的可能性最大而形成的N-gram模型
2.将词语构成看成是标注问题而出现的隐马尔科夫链、条件随机场等模型。
详情可参见博客。
求问,求补充
N-gram和HMM、CRF的区别?个人认为,N-gram是基于统计的,没有标注问题。
而HMM、CRF引入了一个中间变量(即状态)。
相关文章推荐
- 2018校招唯品会软件测试岗在线笔试
- 美团2018算法岗校招笔试第一题
- 2016年头条校招笔试(LRU算法)
- 2018小红书校招软件研发在线笔试编程第二题
- 2018大疆校招软件岗位笔试题目(求有效工作时间)——未在线验证
- 【2018校招美团笔试编程题2】改考卷
- 搜狐集团2018秋季校招笔试题 包裹问题
- 【2018校招笔试-京东=java开发】题目1括号匹配方案
- 企鹅2015校招笔试之(三)C/S模型压力算法设计实现
- 爱奇艺2018秋季校招算法工程师(第一场)C 平方串【划分+LCS】B 奶牛编号【排序】A 括号匹配深度【栈】
- 【笔试面试】美团网-2016年校招-机器学习和数据挖掘
- 2018校招三七互娱软件测试岗笔试题
- 58同城2018校招前端笔试题总结
- 网易2018校招笔试_小易喜欢的数列_C++
- 2018美团点评笔试(机器学习,数据挖掘方向)编程题题解
- 爱奇艺2018秋季校招算法工程师(第二场)编程题题解
- 【网易】2018校招笔试题
- 【笔试题】拼多多2018校招内推编程
- (网易2018校招笔试)[编程题]相反数
- 机器学习笔试面试系列算法集锦