您的位置:首页 > 理论基础

《全国计算机等级考试三级教程》章节学习记录——第三章.数据库结构设计

2016-09-01 16:20 537 查看
一.数据库概念设计

1.概念设计任务:

定义和描述应用领域涉及的数据范围;
获取应用领域或问题域的信息模型;
描述清楚数据之间的关系;
定义和描述数据的约束;
说明数据的安全性要求;
支持用户的各种数据处理需求;
保证信息模型方便地转换成数据库的逻辑结构(数据库模式),同时也便于为用户理解。
2.概念设计的依据及过程:

概念设计的依据:需求说明、功能模型等;
概念设计的过程:明确建模目标、定义实体集(分类标识、概括命名)、定义联系(建立联系矩阵)、建立信息模型(ER方法)、确定实体集属性、对信息模型进行集成与优化。
3.数据建模方法:

ER建模方法:实体或实例(张三、一场演出)、实体集(学生)、属性(学号)、码(学号)、联系(一对一联系、一对多联系、多对多联系)。
IDEF1X建模方法:实体集(独立实体集、从属实体集)、联系(标定型联系、非标定型联系、分类联系、非确定联系)。
二.数据库逻辑设计

把数据库概念设计的结果(ER模型)转换为具体的数据库管理系统支持的数据模型。
三.数据库物理设计

数据库物理结构角度需解决的问题:文件的组织、文件的结构、文件的存取、索引技术(有序索引技术(聚集索引和非聚集索引、稠密索引和稀疏索引、主索引和辅索引、唯一索引、单层索引和多层索引)、散列技术;索引技术的关键是建立记录域取值到记录的物理地址间的隐射关系)。
数据库物理设计主要包括的环节:数据库逻辑模式描述、文件组织与存取设计、数据分布设计、确定系统配置、物理模式评估。
1.数据库逻辑模式描述:面向目标数据库描述基本表和视图、设计基本表业务规则。

2.DB文件组织与存取设计:使用事物-基本表交叉引用矩阵、估计各事务的执行频率、汇总作用于每张基本表上的各事务的操作频率信息。

为基本表选择合适的文件结构的原则堆文件(无需建立索引,数据访问效率较低,故适用数据量少,操作频繁。当需要向新创建的基本表批量加载数据时,可将表的文件结构先选为堆文件,向表中加载数据后再重新调整文件结构,如改成数据查询效率更高的B+数文件);顺序文件(支持基于查找码的顺序访问和快速的二分查找,适用于查询条件定义在查找码上的情况);散列文件(适用于查询基于散列域值得等值匹配,尤其是访问顺序是随机的。但不适用于基于散列域值的非精确查询如模糊查询、范围查询及基于非散列域进行的查询);B-树和B+树文件(适用于定义在大数据量基本表上、基于查找码的等值查询、范围查询、模糊查询和部分查询,属于动态索引,可随着数据文件的内容变化不断调整,保证数据查询的性能不会恶化)。
决定是否为一个基本表建立索引原则:对于经常查询、连接、统计操作且数据量大的基本表考虑建立索引,而经常插入、删除、更新操作或小数据量的基本表则尽量避免建立索引;一个基本表可以建立一个聚集索引和多个非聚集索引,但对于一个更新频繁的表应少建或不建索引;索引可以由用户根据需要随时创建或删除,以提高数据查询性能。
可考虑在基本表某些属性上建立索引:表的主码、在WHERE查询子句中引用率较高的属性、参与连接操作的属性、在Order By子句、Group By子句中出现的属性、在某一范围内频繁搜索的属性(但只有当使用索引的查询其结果不超过记录总数的20%时索引才会有明显效果)、考虑在WHERE子句中同时包含的一个表中的多个属性上建立多属性索引(散列索引适用于频繁执行精确匹配查询,B+树等有序索引适合范围查询)、当一个属性有相对较多的不同值时使用索引有明显效果、很多数据库管理系统中的索引不引用具有空值的行,对空值的查找需要使用全表扫描来实现,故对包含大量空值的属性建立索引时要仔细考虑。
3.数据分布设计:

不同类型数据的物理分布
应用数据的划分与分布:分布式数据库系统(DDBS);水平划分将一张基本表划分为多张具有相同属性、结构完全相同的子表,子表包含的元组是基本表中元组的子集(例如对商品按照商品的生产年份进行划分);垂直划分则是将一张基本表划分为多张子表,每张子表包含的属性是原基本表的子集,每张子表必须包含基本表的主键。
派生属性数据分布
关系模式的去规范化
4.确定系统配置

存储分配参数:数据库配置参数(如允许同时使用数据库的用户数、允许同时打开数据库对象数、数据库初始空间大小)、磁盘块使用参数、内存缓冲区参数(如缓冲区个数和大小)、时间片大小、装填因子、锁的数目。

5.物理模式评估

通过对时间效率、空间效率、维护代价和各种用户要求权衡考虑,产生多个设计备选方案,从中评估。


今天的学习结束啦~~撒花!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息