您的位置:首页 > 其它

顶尖数据科学家之必备技能

2019-08-14 11:18 253 查看
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/liu_rockefeller/article/details/99544264

这篇文章来自KDnuggets原文:
《Top 13 Skills To Become a Rockstar Data Scientist》

  1. 教育
    一般数据科学家受教育成程度高,88%至少拥有硕士学位,46%拥有博士学位,虽然也有少数的例外,但通常需要比较深厚的教育背景来培养成为数据科学家所必需的知识深度。并且,他们还需进行在线培训,来学习如何使用Hadoop或大数据查询等特殊技能。
  2. R 编程
    R是专门为数据科学需求而设计的。你可以使用R来解决在数据科学中遇到的任何问题。事实上,43%的数据科学家使用R来解决统计问题。
  3. Python 编程
    根据O’Reilly 的调查,数据科学家有40%使用 Python 作为的它们的主要编程语言。由于它的多功能性,你可以将 Python 用于几乎所有涉及到数据科学过程的步骤。它可以采用各种格式的数据,你可以轻松地将SQL表导入到代码中。它允许你创建数据集,你也可以在谷歌上找到你需要的任何类型的数据集。
  4. Hadoop
    作为数据科学家,您可能会遇到这样的情况,即您拥有的数据量超过系统内存或者需要将数据发送到不同的服务器,这时就是 Hadoop 的用武之地。您可以使用Hadoop快速将数据传输到各系统节点。你也可以使用Hadoop 进行数据过滤,数据采样和汇总。
  5. SQL
    作为数据科学家,你需要精通SQL。这是因为 SQL 专门用于帮助您访问处理数据。当您使用它来查询数据库时,它还会为您提供洞见。 它具有简洁的命令,可以帮助你节省时间并减少执行困难查询所需的编程量。
  6. Apache Spark
    Apache Spark正在成为全球最受欢迎的大数据技术。 它就像Hadoop一样是一个大数据计算框架。 唯一的区别是Spark比Hadoop更快。 这是因为Hadoop读取和写入磁盘,这使得速度变慢,但Spark将其计算缓存在内存中。
    Apache Spark专为数据科学而设计,可帮助更快地运行其复杂的算法。 当你处理大量数据时,会节省时间很多。 它还有助于数据科学家处理复杂的非结构化数据集。 你可以在一台机器或一组机器上使用它。
  7. Machine Learning and AI
    如果你想从其他数据科学家中脱颖而出,你需要了解机器学习技术,如监督机器学习,决策树,逻辑回归等。
  8. 数据可视化(Data Visualization)
    商业世界经常产生大量的数据。这些数据需要转换成易于理解的格式。相对原始数据,人们更容易理解图片和图表。
  9. 非结构化数据(Unstructured data)
    非结构化数据是未定义的内容,不适合数据库表存储。包括视频,博客帖子,客户评论,社交媒体帖子,音频等。
    由于其复杂性,大多数人将非结构化数据称为“黑暗分析(dark analytics)”。 使用非结构化数据可帮助你产生对决策有用的洞察力。 作为数据科学家,你必须能够理解和操纵来自不同平台的非结构化数据。
  10. 求知欲(Intellectual curiosity)
    求知欲可以被定义为获得更多知识的愿望。 作为数据科学家,你需要能够提出有关数据的问题,因为数据科学家花费大约80%的时间来发现和准备数据。 这是因为数据科学领域是一个发展非常快的领域,你必须学习更多以跟上节奏。
  11. 商业敏锐力(Business acumen)
    要成为一名数据科学家,您需要对你正在从事的行业有充分的了解,并了解贵公司正在努力解决的业务问题。 在数据科学方面,除了确定企业应利用处理数据的新方法之外,还要能够识别哪些问题对于业务而言至关重要。
  12. 沟通技能(Communication skills)
    数据科学家必须使企业能够通过量化的洞察力来制定决策,此外还要了解非技术同事的需求,以便恰当地纠正数据。作为数据科学家,您必须知道如何围绕数据创建故事情节,以便任何人都能轻松理解。
    大多数决策者不想知道你分析的内容,他们对如何积极地影响他们的业务感兴趣。
  13. 团队协作(Teamwork)
    数据科学家不可能单独工作。你将不得不与公司高管合作制定战略,与产品经理和设计师合作以创造更好的产品,与营销人员合作以推出更好的活动,与客户和服务器软件开发人员合作创建数据管道并改进工作流程。 您必须与组织中的每个人(包括您的客户)合作。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: