【自】别跟我扯AI、BI、VI、VE和ML概念!然并卵。2017,我只想知道大数据具体有哪些实用技术,都叫什么?...
我们永远奉行授人以鱼不如授人以渔
记住啦!
1.统计学(业务方向):首要必会技能
任何数据分析师从事业务方向的工作都必须会统计学,因为统计学是一门发现规律的学科,统计学的学习最好辅助 R 、SPSS 来学,做到数据分析基本功扎实,并且兼顾实战性。
同时你需要掌握一些基于行业业务的分析方法,如对比测试( A / B testing )、特设分析( Ad Hoc Analysis )、精益化管理等。将数据分析真正和业务结合,驱动商业运营。
2. SQL(技术方向):首要必会技能
任何数据分析师从事技术方向的工作都必会 SQL,不单是数据分析师,每一个运营、产品经理、尤其是互联网行业,一定要会 SQL,基本知名互联网公司的产品经理都能写 SQL。
学习中,要掌握 SQL 的基础语法、中级语法和常用函数,结合关系数据库系统( Mysql 、Oracle 、SQL Server 、DB2 等)来学习 SQL 语句,找好方法。
强调一点,高级分析师对于SQL系统优化务必牛????,不然我一个计算半天才出结果可不行。
3. R 与 Python:不分伯仲,都要掌握
巧妇难为无米之炊,正如厨师做菜需要锅碗瓢盆,数据分析师比如要掌握一到两门分析工具。
R 语言就是为了统计而存在的语言,我们要掌握 R 语言的基础语法、数据管理、数据挖掘建模与评估等。作为入门,我推荐 R 语言。
Python 主要掌握基础语法,pandas 操作、numpy 操作、sklearn 建模,学会用 python 编写网络爬虫爬取数据,等等。
以上是我们第三阶段要学的技能。
4.数据可视化
俗话说,一图胜前沿,可视化说白了,就是画图,但做为数据分析师来说,我们不能用 EXCEL 来实现可视化,因为它的局限性太大了。
记住,做数据分析有句名言,No picture 你 say个鸡吧。
R 中可视化工具有 plot 基础库、ggplot2 、Rechart ;
Python 中可视化的工具有 matplotlib , seaborn , ploltly ;
随心所欲,用R或者 Python,你就知道做数据分析工作是多么爽一个事。
5.数据挖掘
在这里,你需要掌握分类变量与连续变量分析的方法,如线性回归、逻辑回归、方差分析、时间序列等方法。同时为了进一步扩展你的能力,你可能需要掌握一些描述性及预测性数据挖掘方法,如分类、聚类、决策树、KNN 、随机森林、神经网络、组合算法等。
记住,以上讲的还属于基础知识结构介绍,以下的可是秘籍谶语,切记切记!
无论什么大数据分析都是基于人类需求和活动的,都是有场景的,所以你要尽可能了解你的行业才能把技术用的伊格伊格的
- 点赞
- 收藏
- 分享
- 文章举报
- 没有他们,什么AI、BI和BD都是空中楼阁!—–hadoop、spark、CM、CDH之数据构架实务...
- 没有他们,什么AI、BI和BD都是空中楼阁!—–hadoop、spark、CM、CDH之数据构架实务...
- 数据分析行业,主要有哪些基本职位,具体的职责是什么?
- ICT 2017 | Arm全球执行副总裁兼大中华区总裁吴雄昂:数据和AI技术引领新一轮的技术革命
- 什么是数据挖掘技术,基本概念是什么?
- AI技术大盘点: 神经网络/机器学习/深度学习/大数据…你想知道的都在这些图里了
- 怎样判断一个泛型的数据具体是什么类型
- Introspector内省和反射的区别. 什么是Bean,对应的jdk概念有哪些,
- 简述什么是ajax?ajax工作原理?ajax包含的技术?ajax有哪些优点缺陷?
- 数据挖掘概念与技术——
- 【读书笔记-数据挖掘概念与技术】离群点检测
- AI、5G赋能业务,各互联网企业的技术大佬究竟在关心什么问题?
- 【炼数成金 RapidMiner 一 】数据挖掘概念与技术原书第三版(第一章)1.9节的习题解...
- 如何实现把CListCtrl类中的数据存储到txt或excel中,并且存储位置可以自己选择?具体代码是什么?
- AI技术的天花板:图灵机无法建立“自我”意识的概念
- 中烟项目日志:IBM产品与技术描述、BI、数据仓库、ETL
- 大数据处理关键技术主要有五种,具体指的是什么?
- 什么是沙盒模型?怎么写入、读取沙盒路径文件数据,哪些操作是属于私有api范畴
- 学习大数据需要掌握哪些Java技术
- 数据挖掘概念与技术(韩家伟)阅读笔记5--数据规范化和属性构造