您的位置:首页 > 职场人生

【自己整理的答案】2013百度校园招聘-机器学习和数据挖掘工程师-笔试题

2015-03-20 15:18 295 查看
一、简答题(30分)
1、简述数据库操作的步骤(10分)

  步骤:建立数据库连接、打开数据库连接、建立数据库命令、运行数据库命令、保存数据库命令、关闭数据库连接。
2、TCP/IP的四层结构(10分)

  四个层次:应用层、传输层、网络互连层、主机到网络层。 参考





3、什么是MVC结构,简要介绍各层结构的作用(10分)

  MVC结构是模型(Model),视图(view)和控制(controller)的缩写,其目的是石岩Web系统的职能分工。其中Model层实现系统的业务逻辑,通常可以用JavaBean或EJB来实现;View层用于与用户的交互,通常用Jsp来实现;controller层是Model与View之间的沟通的桥梁,它可以分派用户的请求并选择恰当的视图以用于显示,同时它也可以解释用户的输入并将它们映射为模型层可执行的操作。参考





二、算法与程序设计(45分)
1、由a-z、0-9组成3位的字符密码,设计一个算法,列出并打印所有可能的密码组合(可用伪代码、C、C++、Java实现)(15分)

   题中并没有给出字符密码的规则,所以组合数有36*36*36种。这里直接用了最简单的存储遍历方法。





2、实现字符串反转函数(15分)

  借用了java语言的一些特点实现的。





3、百度凤巢系统,广告客户购买一系列关键词,数据结构如下:(15分)
User1 手机 智能手机 iphone 台式机 …
User2 手机 iphone 笔记本电脑 三星手机 …
User3 htc 平板电脑 手机 …
(1)根据以上数据结构对关键词进行KMeans聚类,请列出关键词的向量表示、距离公式和KMeans算法的整体步骤

  关键词的向量表示:

  ???这个不是很明白

  距离公式:

  采用向量之间夹角的余弦值表示 :



 K-Means算法的整体步骤:

  1>初始时随机选择K个中心点;

  2>为其他点找出距离最近的中心点;

  3>重新计算中心点;

  4>跳转至步骤2,直到满足收敛条件;

(2)计算给定关键词与客户关键词的文字相关性,请列出关键词与客户的表达符号和计算公式

???
三、系统设计题(25分)
一维数据的拟合,给定数据集{xi,yi}(i=1,…,n),xi是训练数据,yi是对应的预期值。拟使用线性、二次、高次等函数进行拟合
线性:f(x)=ax+b
二次:f(x)=ax^2+bx+c
三次:f(x)=ax^3+bx^2+cx+d
(1)请依次列出线性、二次、三次拟合的误差函数表达式(2分)



 

thta表示参数向量。

(2)按照梯度下降法进行拟合,请给出具体的推导过程。(7分)

参考 





(3)下图给出了线性、二次和七次拟合的效果图。请说明进行数据拟合时,需要考虑哪些问题。在本例中,你选择哪种拟合函数。(8分)
(4)给出实验方案(8分)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  机器学习 面试