您的位置:首页 > 其它

数据科学初学者九种常见错误

2017-07-04 00:00 239 查看
摘要: 当开始进入数据科学领域时,我们可能会犯一些错误。本文罗列了9种初学者常见的错误,并提出避免犯错的建议。

更多深度文章,请关注:https://yq.aliyun.com/cloud

如果你想开始一个数据科学方面的职业,你可以通过避免这9个会使你付出高代价的初学者错误来免去几天,几个星期甚至几个月的挫折。

如果你不仔细,这些错误将会消耗你最宝贵的资源:你的时间、精力和动力。

我们将它们分为三类:

学习数据科学时的错误

求职时的错误

求职面试中的错误



学习数据科学

第一组错误是“隐蔽的”,很难发现。没有丝毫的预兆,它们如同温水煮青蛙般耗尽你的时间和精力,并且它们产生的误解围绕这个领域。

1.花费太多时间在理论上

许多初学者陷入了花费太多时间在理论上的陷阱,无论是数学相关(线性代数,统计学等)还是机器学习相关的(算法,派生等)。

这种方法效率低下有三个主要原因:

首先,这是缓慢而艰巨的。如果你曾经被所有要学的东西压垮,那么你很有可能陷入了这个陷阱。

第二,你也不会保留这些概念。数据科学是一个应用领域,而巩固技能的最好方法是实践。

最后,还有一个更大的风险就是如果你不明白你所学的东西与现实内容有什么联系,那么你会变得消极然后放弃。

传统上这种重理论的方法在学术界中传授,但大多数从业者可以从更注重结果的观念中受益。

为了避免这个错误:

平衡你的研究和你实践的项目。

学会适应局部知识。当你进步的时候,你自然会填补空白。

了解每一部分如何适应大局(包括在我们免费7天速成课程)。

2.从头开始编写太多的算法

下一个错误也会导致学生片面重视局部而忽略了整体。一开始你真的不需要从头开始编写每个算法。

虽然为了学习而实现一些这么做很好,但现实是算法正在成为商品。由于成熟的机器学习库和基于云的解决方案,大多数从业者实际上从不从头编写代码。

今天,了解如何在正确的设置(以正确的方式)中应用正确的算法更为重要。

为了避免这个错误:

使用通用的机器学习库,如Scikit-Learn(Python)Caret(R)(需翻墙)。

如果你从头开始编写一个算法,那么这样做是为了学习而不是完善你的实现。

理解现代机器学习算法的环境及其优缺点。

3.急于深入更高的层次

有些人进入这个领域是因为他们想要构建未来的技术:自驾车,高级机器人,计算机视觉等。 这些技术由深度学习和自然语言处理等技术所驱动。

但是,掌握基本原理很重要。 一口吃不成胖子。每个奥运潜水员都需要先学习如何游泳,那么你也应该如此。

为了避免这个错误:

首先掌握“经典”机器学习的技术和算法,以此作为高级课题的基石。

要知道经典机器学习仍然具有惊人的潜力。虽然算法已经成熟,但我们仍然处于发现使用富有成效的方法的早期阶段。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: