您的位置:首页 > 其它

菜鸟数据分析展望篇(希望持续)

2015-09-24 15:53 85 查看
       文笔不是很好,这是一个不能回避的现实。不能掩盖,因为越掩盖,缺点就会不断地放大,那就永远无法提高。

        我作为统计学专业的方面的学生,热爱自己的专业,但是却对自己的专业也可以说一知半解。譬如算法、SQL、R等等一系列需要掌握的东西,或是你会这样说,学这么多又有什么用,有时候我也是专业那个想,学的这么多,又有什么用。但,要成长,已经选好了在一个方面发展,那就要不断地学习这方面的知识,绝对不能止足不前。可以用一句话来解释,我并不富裕,或是也可以这样说,我憧憬富裕的生活,再继续往下说就扯到人生这种话题了。暂且落下,下次再说。

        数据分析,并不是一个简简单单的工作,提取数据、筛选数据、处理数据、分析数据、形成报告、决策支持。这其中的每一步,都需要数据分析师的参与。

提取数据:就要提到数据库,数据库包含许多方面,有数据库的开发、你需要去掌握SQL的优化,还要去掌握如 MongoDB、Hbase、Memcached或Redis等NoSQL技术,这是基于底层数据库的开发,过于艰难,或是并不是自己的兴趣点,不会去做。在数据提取这一块,我想要去掌握的是快速地从sql数据库中提取到自己所需要的数据。

       数据处理方面,原生的数据存在着很多噪声,需要进行处理,这就需要自己去掌握数据处理方面的能力。

       分析数据,要有工具去进行数据分析,Python,R,excel,是我今后一年的努力方向,要学习,并可以在网上通过各类的数据处理比赛积累自己的项目经验。

当然除了工具的熟练掌握,还需要统计知识的扎实,算法,尤其重要,面对着庞大的数据,该如何处理得到自己想要知道的信息或是从数据中处理得到有价值的信息,需要一系列的算法,并通过数据处理工具。

       报告,那就需要自己对所分析的数据所处行业的理解,这就需要经验的积累,以及行业信息的积累,这样才能形成有用的报告。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  数据分析