脏数据
2015-09-09 19:52
204 查看
从广义上看。脏数据是指没有进行过数据预处理而直接接收到的、处于原始状态的数据。
从狭义上看,是不符合研究要求,以及不可以对其直接进行对应的数据分析。
脏数据根据不同的分析目的有不同的定义。如在常见的数据挖掘工作中。脏数据是指不完整、含噪声、不一致的数据;而在问卷分析中,脏数据则是指不符合问卷要求的数据。
开发中:
脏数据是指源系统中的数据不在给定的范围内或对于实际业务毫无意义,或是数据格式非法,以及在源系统中存在不规范的编码和含糊的业务逻辑。
在数据库技术中,脏数据在暂时更新(脏读)中产生。
事务A更新了某个数据项X,可是因为某种原因。事务A出现了问题。于是要把A回滚。
可是在回滚之前。还有一个事务B读取了数据项X的值(A更新后),A回滚了事务,数据项恢复了原值。事务B读取的就是数据项X的就是一个“暂时”的值,就是脏数据。
通俗的讲,当一个事务正在訪问数据,而且对数据进行了改动。而这样的改动还没有提交到数据库中,这时。另外一个事务也訪问这个数据。然后使用了这个数据。由于这个数据是还没有提交的数据,那么另外一个事务读到的这个数据是脏数据,根据脏数据所做的操作可能是不对的。
此文加深理解,仅为记录所用。
參考:
http://zh.wikipedia.org/wiki/%E8%84%8F%E6%95%B0%E6%8D%AE
http://baike.baidu.com/view/1445322.htm?
fr=aladdin
从狭义上看,是不符合研究要求,以及不可以对其直接进行对应的数据分析。
脏数据根据不同的分析目的有不同的定义。如在常见的数据挖掘工作中。脏数据是指不完整、含噪声、不一致的数据;而在问卷分析中,脏数据则是指不符合问卷要求的数据。
开发中:
脏数据是指源系统中的数据不在给定的范围内或对于实际业务毫无意义,或是数据格式非法,以及在源系统中存在不规范的编码和含糊的业务逻辑。
在数据库技术中,脏数据在暂时更新(脏读)中产生。
事务A更新了某个数据项X,可是因为某种原因。事务A出现了问题。于是要把A回滚。
可是在回滚之前。还有一个事务B读取了数据项X的值(A更新后),A回滚了事务,数据项恢复了原值。事务B读取的就是数据项X的就是一个“暂时”的值,就是脏数据。
通俗的讲,当一个事务正在訪问数据,而且对数据进行了改动。而这样的改动还没有提交到数据库中,这时。另外一个事务也訪问这个数据。然后使用了这个数据。由于这个数据是还没有提交的数据,那么另外一个事务读到的这个数据是脏数据,根据脏数据所做的操作可能是不对的。
此文加深理解,仅为记录所用。
參考:
http://zh.wikipedia.org/wiki/%E8%84%8F%E6%95%B0%E6%8D%AE
http://baike.baidu.com/view/1445322.htm?
fr=aladdin
相关文章推荐
- shapefile文件
- Python 产生两个方法将不被所述多个随机数的特定范围内反复
- USACO 1.1 Broken Necklace (模拟)
- Java- 字符串(String,StringBuffer,StringBuilder类)
- HDU 2181 哈密顿绕行世界问题 (DFS)
- 实验三 敏捷开发与XP实践
- LeetCode----First Missing Positive
- mysql 数据库远程批量更新脚本(部份参考)
- 学习历程
- Spring Data中手动实现Repository方法
- 教你快速高效接入SDK——服务器端支付回调的处理方式
- 感悟~勿忘初心
- Ubuntu Eclipse for C++ 11
- POJ 1985 Cow Marathon(求树的直径)
- Count and Say
- iOSInterviewQuestions/iOS面试问题
- codevs 3147 3147 矩阵乘法 2
- struts2的constant配置
- 为什么开始
- 菜鸟系列——双连通分量