大数据算法学习笔记(1):定义与特点
2015-06-28 10:07
369 查看
大数据定义:至今无公认。
1、所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理为人类所能解读的信息。
2、不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法。
3、需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
特点:
1、多样性、复杂性(Variety):多源异构。多个信息源,构造方式多样。
2、速度(Velocity):数据更新速度快。
3、数据量(Volume):规模庞大。PB将是常态
4、具有高度分析的新价值
应用:
1、预测。分析发展趋势。
2、推荐。
3、商业情报分析。
4、科学研究。
1、所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理为人类所能解读的信息。
2、不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法。
3、需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
特点:
1、多样性、复杂性(Variety):多源异构。多个信息源,构造方式多样。
2、速度(Velocity):数据更新速度快。
3、数据量(Volume):规模庞大。PB将是常态
4、具有高度分析的新价值
应用:
1、预测。分析发展趋势。
2、推荐。
3、商业情报分析。
4、科学研究。
相关文章推荐
- LeetCode | Contains Duplicate II
- LeetCode | Contains Duplicate
- 浅谈 C++ 中的 new/delete 和 new[]/delete[]http://blog.csdn.net/hazir/article/details/21413833
- malloc/free和new/delete的区别 http://blog.csdn.net/chance_wang/article/details/1609081
- Glibc configure problem: fails sanity check.
- Failed to execute goal org.apache.maven.plugins:maven-surefire-plugin
- Contains Duplicate
- Contains Duplicate II
- 线程之sleep(),wait(),yield(),join()等等的方法的区别
- 开发基于大数据平台的搜索引擎
- ARM Cortex M0权威指南_PDF电子书下载 带书签目录 高清完整版 http://pan.baidu.com/s/1jGKQSwY MariaDB入门很简单_PDF电子书下载 带
- 大数据
- 【翻译自mos文章】11.2 RAC: In "crsctl stat res -t" State Details May Be Missing or Incorrect
- vs2008 error C2440: “static_cast”: 无法从“void (__thiscall CMainFrame::* )(void)”转换为“LRESULT (__thiscal
- 大数据并行计算利器之MPI/OpenMP
- poj 1218 THE DRUNK JAILER
- mysql 大数据量的处理
- windows下mysql主从出现Failed to open the relay log(relay_log_pos 248)解决办法
- Naive Bayes 笔记
- HDOJ 5029 Relief grain