大数据可视化第一天——前期准备
2017-07-21 10:03
183 查看
我认为无论学习什么知识,有一个战略性的思想指导是很必要的,这样在面对各种技术时才不会盲目学习。所有的技术想要钻研深入都不容易,要明确自己学习这个技术的目的是什么。
于我而言,数据可视化一方面是为了在做算法或数据分析之前对自己所要研究的数据有一个初期的了解,另一方面是为了展示算法的分析结果,比较有无算法优化情况下问题的解决方式和代价,其中第二点是主要目的,因为第一点一般通过数据各方面的统计就可以完成。
读了Packt的《Big data visualization》,其中关于数据可视化的几点概念性指导非常有道理,在此记录下来。
数据可视化通过一种常规化的方式来表达自己的观念,让目标受众迅速的理解你所表达的观点。
如何选择最合适和有效的可视化方法。
了解数据的大小(这个还是蛮重要的,十万级别的数据量还可以通过R比较快速的分析,百万的话就比较慢了)
了解数据所产生的环境
明确自己想要表达的信息和观点
明确目标受众特点
明确什么样的可视化效果可以最有效的传达自己的观点
其中“三个明确”对于我工作的主要目的是最具指导性的,因为工作性质,需要把成果以一个明确漂亮的方式展现给负责人或领导,算法做的好可视化也要做好,这也算是需求分析或者说用户画像吧-_-,以后每次做成果展示都要回头来看看这三个明确。
工作中的编程语言,主要的Python、R、Java已经被选择好了,Python用于算法研究、R用于快速分析、Java用于微服务平台的开发,可视化方面我准备先学习一下D3.js,至于three.js、OpenGL、WebGL用到的话再说吧。这些可视化语言只作为工具,可以熟练使用即可,不打算深究其中原理和优化。
编程工具的话Python就用Spyder、R就用Rstudio、Java因为之前只用过Eclipse所以就暂定这个吧,前端今天尝试了一下HBuilder,感觉还比较好用。
于我而言,数据可视化一方面是为了在做算法或数据分析之前对自己所要研究的数据有一个初期的了解,另一方面是为了展示算法的分析结果,比较有无算法优化情况下问题的解决方式和代价,其中第二点是主要目的,因为第一点一般通过数据各方面的统计就可以完成。
读了Packt的《Big data visualization》,其中关于数据可视化的几点概念性指导非常有道理,在此记录下来。
数据可视化通过一种常规化的方式来表达自己的观念,让目标受众迅速的理解你所表达的观点。
如何选择最合适和有效的可视化方法。
了解数据的大小(这个还是蛮重要的,十万级别的数据量还可以通过R比较快速的分析,百万的话就比较慢了)
了解数据所产生的环境
明确自己想要表达的信息和观点
明确目标受众特点
明确什么样的可视化效果可以最有效的传达自己的观点
其中“三个明确”对于我工作的主要目的是最具指导性的,因为工作性质,需要把成果以一个明确漂亮的方式展现给负责人或领导,算法做的好可视化也要做好,这也算是需求分析或者说用户画像吧-_-,以后每次做成果展示都要回头来看看这三个明确。
工作中的编程语言,主要的Python、R、Java已经被选择好了,Python用于算法研究、R用于快速分析、Java用于微服务平台的开发,可视化方面我准备先学习一下D3.js,至于three.js、OpenGL、WebGL用到的话再说吧。这些可视化语言只作为工具,可以熟练使用即可,不打算深究其中原理和优化。
编程工具的话Python就用Spyder、R就用Rstudio、Java因为之前只用过Eclipse所以就暂定这个吧,前端今天尝试了一下HBuilder,感觉还比较好用。
相关文章推荐
- 集团信息化之路 电子采购系统及前期数据准备及测试接需求差异
- 集团信息化之路 电子采购系统及前期数据准备及测试接需求差异
- 1、lib7z-Memory从内存或网络解压数据(编译源码、前期准备)
- 使用`phy`进行神经网络数据读取及可视化之开发环境准备
- R语言之数据可视化 - 准备
- Python数据挖掘的一些前期准备
- 大数据前期准备---List
- 003 关于shell基础,大数据的前期准备
- Python开发Kettle做大数据ETL(前期准备)
- PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品,产品设计严格遵循国际数据挖掘标准CRISP-DM(跨行业数据挖掘过程标准),具备完备的数据准备、模型构建、模型评估、模型管理、海量数据处理和高纬数据可视化分析能力。
- PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品,产品设计严格遵循国际数据挖掘标准CRISP-DM(跨行业数据挖掘过程标准),具备完备的数据准备、模型构建、模型评估、模型管理、海量数据处理和高纬数据可视化分析能力。
- 数据可视化参考文献/网站/书籍
- 数据采集与埋点简介之 代码埋点、可视化埋点与无痕埋点
- windows serve 2012部署操作系统之部署前期准备(八)
- Python基本数据统计(一)---- 便捷数据获取 & 数据准备和整理 & 数据显示
- Matplotlib学习笔记之数据可视化
- 前期准备之ubuntu10.10下安装skyeye
- 基于matplotlib的数据可视化(图形填充fill fill_between) - 笔记(二)
- 最好用的20个数据可视化工具(三)
- DM36x IPNC OSD显示中文 --- 基本数据准备篇