随想数据的统计与分析
2009-08-20 00:20
232 查看
最近拿到一大堆数据,在对其做完MapReduce统计后,需要提炼一些有价值的数据出来使用。
1. 同一数据重复出现,是否大堆一定概率或者重现数量达到某个范围,就能确定该数据是有效的呢?
2. 数据的时间有效性。若这组数据是跟时间相关的,时间这个参数是否需要考虑进去,具体的时间参考值又需要如何定义呢?
3. 随机出现的干扰数据,是否也有一些规律性呢?一旦这些干扰数据消失,是好事还是坏事呢?
4. 海量数据统计出来的结果是否具有一般性?能否从结果中预测出一些未来数据的走向?
最后,这堆数据跟股票无关。
1. 同一数据重复出现,是否大堆一定概率或者重现数量达到某个范围,就能确定该数据是有效的呢?
2. 数据的时间有效性。若这组数据是跟时间相关的,时间这个参数是否需要考虑进去,具体的时间参考值又需要如何定义呢?
3. 随机出现的干扰数据,是否也有一些规律性呢?一旦这些干扰数据消失,是好事还是坏事呢?
4. 海量数据统计出来的结果是否具有一般性?能否从结果中预测出一些未来数据的走向?
最后,这堆数据跟股票无关。
相关文章推荐
- 统计分析与数据挖掘所涉及的应用领域探讨
- PHP+Hadoop实现数据统计分析
- 利用ODS OUTPTU将统计分析结果保存至数据集中
- 精通Excel数据统计和分析 - 摘要(第5章:回归分析)
- 数据分析、数据挖掘、数据统计、OLAP 之间的差异是什么?
- iOS --- 使用Mixpanel来统计和分析移动APP的用户数据
- 网站数据统计分析之日志收集原理及其实现
- 机器学习、统计分析、数据挖掘、神经网络、人工智能、模式识别之间的关系是什么?
- 分析各种Android设备屏幕分辨率与适配 - 使用大量真实安卓设备采集真实数据统计
- 漫谈redis在运维数据分析中的去重统计方式
- 网站用户行为数据统计与分析之一:埋点代码设计
- 网站用户行为数据统计与分析之七:kibana或elasticsearch-head
- R语言为Hadoop集群数据统计分析带来革命性变化
- 亿量级流量的数据统计分析以及挖掘技术实战(Spark And Storm)
- Excel在统计分析中的应用—第二章—描述性统计-未分组数据的四分位偏差的求解方法
- 移动应用数据统计分析平台对比
- appstore软件销售数据统计分析软件Prismo
- 数据统计分析——基本概念_01
- 空间分析:区域分析之基于shapfile的栅格数据统计
- 移动互联网数据分析 移动客户端流量统计 移动客户端数据统计(三)