您的位置:首页 > 数据库

数据库范式的简单理解

2015-11-22 12:53 246 查看

数据库范式学习

数据库范式是数据库设计中必不可少的知识,没有对范式的理解,就无法设计出高效率、优雅的数据库。甚至设计出错误的数据库。教科书中一般以关系代数的方法来解释数据库范式。这样做虽然能够十分准确的表达数据库范式,但比较抽象,不太直观,不便于理解,更难以记忆。

一、基础概念

实体:现实世界中客观存在并可以被区别的事物。比如“一个学生”、“一本书”、“一门课”等等。值得强调的是这里所说的“事物”不仅仅是看得见摸得着的“东西”,它也可以是虚拟的,不如说“老师与学校的关系”。

属性:教科书上解释为:“实体所具有的某一特性”,由此可见,属性一开始是个逻辑概念,比如说,“性别”是“人”的一个属性。在关系数据库中,属性又是个物理概念,属性可以看作是“表的一列”。

元组:表中的一行就是一个元组。

分量:元组的某个属性值。在一个关系数据库中,它是一个操作原子,即关系数据库在做任何操作的时候,属性是“不可分的”。否则就不是关系数据库了。

码:表中可以唯一确定一个元组的某个属性(或者属性组),如果这样的码有不止一个,那么大家都叫候选码,我们从候选码中挑一个出来做老大,它就叫主码。

全码:如果一个码包含了所有的属性,这个码就是全码。

主属性:一个属性只要在任何一个候选码中出现过,这个属性就是主属性。

非主属性:与上面相反,没有在任何候选码中出现过,这个属性就是非主属性。

外码:一个属性(或属性组),它不是码,但是它别的表的码,它就是外码。

二、6个范式

第一范式:属性不可分,不允许存在隐藏字段,属性保持“原子性”



第二范式:要有主键。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。



第三范式:要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。



正规化范式(BCDF):所有表中的决定因素必须是一个候选键,如果只有一个候选键,那么就和第三范式是一样的。

第四范式(4NF):消除多值依赖。

第五范式(5NF):消除循环依赖。

三、数据库设计基本规则

设计表结构往往都尊从简单的三范式,从其他元素中消除数据冗余问题, 从特定的表中最小化冗余意味着摆脱不必要的数据。

先看看目的,消除数据冗余的影响如下:

❑物理空间需要存储的数据减少。

❑数据变得更有组织。

❑范式化允许修改少量的数据(即单记录)。换言之,一个表的具体字段记录更新时,会影响其他引用他的表。

但是,设计表遵从范式越高则存在“过度设计“的问题,会增加多表间的查询开销,我们只能适度的设计,适度的反范式。如上图中3范式,若就想把楼栋一起查询出来,那从设计上可以分开,另用一个视图将楼栋名称一起查询出来即可。

数据完整性

数据库中的数据是从外界输入的,而数据的输入由于种种原因,会发生输入无效或错误信息。保证输入的数据符合规定,成为了数据库系统,尤其是多用户的关系数据库系统首要关注的问题。数据完整性因此而提出。

数据完整性保证了在数据库中存储数据的一致性和正确性。

实体完整性:保证每一行都能被由称为主键的属性来标识

域完整性:保证在效范围内的值才能存储到相应列中

引用完整性:确保外键的值必须与相关的主键相匹配,禁止在从表中插入包含主表中不存在的关键字的数据行;

用户定义完整性:由用户指定的一组规则

实现数据完整性的主要方式是约束

主键约束 primarykey 确保字段值不重复不为NULL

唯一约束 unique 确保字段值不重复

外键约束 foreignkey 确保字段值必须来自于指定表

检查约束 check 确保字段值的取值范围

缺省约束default 给相应字段提供默认值

注:约束即可在创表时创建,也可在已存在的表上添加
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: