关系数据库的规范化理论与数据库设计
一、关系模式的设计问题
给出一组数据,如何构造一个适合于它们的数据库模式,这是数据库设计的问题。
关系数据库设计理论主要包括三个方面的内容:数据依赖,范式,模式设计方法。其中数据依赖起着核心作用。
把现实问题的所有属性组成一个关系模式,记为R(U),它由属性集U和U上成立的数据完整性约束集组成。关系r是关系模式R(U)的当前值,是一个元组的集合。这里的关系模式和关系一般称为泛关系模式和泛关系。用一个关系模式的集合P={Rl,R2,。。。,RK}来代替R,其中每个Ri(1≤i≤k)的属性是U的子集。这里的P称为数据库模式。对数据库模式的每一个关系模式赋予一个当前值,就得到一个数据库实例(简称数据库)
泛关系模式存在的存储异常问题有:数据冗余,更新异常,删除异常。
二、函数依赖
三、关系模式的分解特性
四、关系模式的范式
五、数据库设计
数据库设计是指对于一个给定的应用环境,提供一个确定最优数据模型与处理模式的逻辑设计,以及一个确定数据库存储结构与存取方法的物理设计,建立起既能反映现实世界信息和信息联系,满足用户数据要求和加工要求,又能被某个数据库管理系统所接受,同时能实现系统目标,并有效存取数据的数据库。
六、规划
规划阶段的主要任务是进行建立数据库的必要性及可行性分析,确定数据库系统在组织中和信息系统中的地位,以及各个数据库之间的联系。
七、需求分析
需求分析阶段应该对系统的整个应用情况作全面的、详细的调查,确定企业组织的目标,收集支持系统总的设计目标的基础数据和对这些数据的要求,确定用户的需求,并把这些要求写成用户和数据库设计者都能接受的文档。需求分析就是把总体信息需求、处理需求以及企业自身的制约条件等几方面的因素进行综合考虑,最后规划出一份既切合实际,又具有远见的需求说明书。
需求分析大致分为三步来完成,即需求信息的收集、分析整理和评审。需求信息的收集又称为系统调查,在调查研究之前,要做好充分的准备工作,要明确调查的目的、调查的内容和调查的形式。需求信息的分析整理包括业务流程分析和分析结果的描述,业务流程分析一般采用数据流分析法,分析结果以数据流图(DFD)表示,除了DFD以外,还要用一些规范表格进行补充描述。评审的目的在于确认某一阶段的任务是否全部完成,以避免重大的疏漏或错误。
八、概念设计
概念设计的目标是产生反映企业组织信息需求的数据库概念结构,即概念模式。概念模式是独立于数据库逻辑结构,独立于支持数据库的DBMS,不依赖于计算机系统的。概念设计的必要性表现在:
(1)数据库设计过程中各阶段的任务相对单一化,设计复杂程度大大降低,便于组织管理;
(2)不受特定的DBMS的限制,也独立于存储安排和效率方面的考虑,因而比逻辑模式更为稳定;
(3)概念模式不含具体的DBMS所附加的技术细节,更容易为用户所理解,因而才有可能准确地反映用户的信息要求。
九、逻辑设计
逻辑设计的目的是把概念设计阶段设计好的基本ER图转换为与选用的具体机器上的 DBMS所支持的数据模型相符合的逻辑结构(包括数据库模式和外模式)。这些模式在功能上、完整性和一致性约束及数据库的可扩充性等方面均应满足用户的各种要求。
在逻辑设计阶段主要输入如下信息:
(1)独立于DBMS的概念模式;
(2)处理需求;
(3)约束条件;
(4)DBMS特性。
在逻辑设计阶段主要输出如下信息:
(1)DBMS可处理的模式;
(2)子模式;
(3)应用程序设计指南;
(4)物理设计指南。
逻辑设计的主要步骤有:
(1)初始模式的形成;
(2)子模式设计
(3)应用程序设计梗概;
(4)模式评价;
(5)修正模式。
ER模型中的主要成分是实体类型和联系类型。在ER模型向关系模型转换是时:
(1)实体类型。将每个实体类型转换成一个关系模式,实体的属性即为关系模式的属性,实体标识符为关系模式的键。
(2)联系类型。
①若实体间的联系是1:1的,可以在两个实体类型转换成的两个关系模式中任意一个关系模式的属性中加入另一个关系模式的键和联系类型的属性
②若实体间的联系是1:N的,则在N端实体类型转换成的关系模式中加入1端实体类型转换成的关系模式的键和联系类型的属性;
③若实体间联系是M:N的,则将联系类型也转换成关系模式,其属性为两端实体类型的键加上联系类型的属性,而键为两端实体键的组合。
关系数据库的逻辑设计过程为:
(1)从ER模式导出初始关系模式。
(2)规范化处理:确定规范级别和实施规范化处理。
(3)模式评价:包括功能评价和性能评价。
(4)模式修正:可采用合并、分解或选用另外结构的方式进行。在经过模式评阶及修正的反复多次后,最终的数据库模式得以确定,全局逻辑结构设计即告结束。在逻辑设计阶段,还要设计出全部子模式。
十、物理设计
对一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,称为数据库的物理设计。所谓数据库的物理结构,主要指数据库在物理设备上的存储结构和存取方法。它是完全依赖于给定的计算机系统的。在物理结构中,数据的基本单位是存储记录。“文件”是某一类型的所有存储记录的集合。一般我们用“文件”表示单记录类型的物理数据库。
物理设计可分五步来完成:
(1)存储记录结构设计:包括记录的组成、数据项的类型和长度,以及逻辑记录到存储记录的映射;
(2)确定数据存储安排;
(3)访问方法的设计;
(4)完整性和完全性;
(5)程序设计。
前三步涉及到物理数据库结构的设计,后两步涉及到约束和具体的程序设计。物理设计阶段的输出是物理数据库结构说明书,包括存储记录格式、存储记录位置及访问方法。它能满足所有的操作需求并给出对硬件、软件系统的约束。在设计过程中效率问题只能在各种约束得到满足且获得可行方案之后进行。
十一、实现与维护
在数据的实现与维护阶段,设计人员运用DBMS提供的数据定义语立,将逻辑设计和物理设计的结果严格地描述出来,成为DBMS可接受的源代码,经过调试产生目标模式,然后组织数据入库。实现阶段的主要工作有:
(1)建立实际数据库结构;
(2)试运行;
(3)装人数据。
在数据库正式投入使用之前,还有一些工作要做。如数据库的重新组织设计,故障恢复方案设设计、安全性考虑和事务控制等。
运行维护阶段的主要工作是:
(1)维护数据库的安全性与完整性控制及系统的转储和恢复;
(2)性能的监督、分析与改进;
(3)增加新功能;
(4)发现错误,修改错误
一、关系模式的设计问题
给出一组数据,如何构造一个适合于它们的数据库模式,这是数据库设计的问题。
关系数据库设计理论主要包括三个方面的内容:数据依赖,范式,模式设计方法。其中数据依赖起着核心作用。
把现实问题的所有属性组成一个关系模式,记为R(U),它由属性集U和U上成立的数据完整性约束集组成。关系r是关系模式R(U)的当前值,是一个元组的集合。这里的关系模式和关系一般称为泛关系模式和泛关系。用一个关系模式的集合P={Rl,R2,。。。,RK}来代替R,其中每个Ri(1≤i≤k)的属性是U的子集。这里的P称为数据库模式。对数据库模式的每一个关系模式赋予一个当前值,就得到一个数据库实例(简称数据库)
泛关系模式存在的存储异常问题有:数据冗余,更新异常,删除异常。
二、函数依赖
三、关系模式的分解特性
四、关系模式的范式
五、数据库设计
数据库设计是指对于一个给定的应用环境,提供一个确定最优数据模型与处理模式的逻辑设计,以及一个确定数据库存储结构与存取方法的物理设计,建立起既能反映现实世界信息和信息联系,满足用户数据要求和加工要求,又能被某个数据库管理系统所接受,同时能实现系统目标,并有效存取数据的数据库。
六、规划
规划阶段的主要任务是进行建立数据库的必要性及可行性分析,确定数据库系统在组织中和信息系统中的地位,以及各个数据库之间的联系。
七、需求分析
需求分析阶段应该对系统的整个应用情况作全面的、详细的调查,确定企业组织的目标,收集支持系统总的设计目标的基础数据和对这些数据的要求,确定用户的需求,并把这些要求写成用户和数据库设计者都能接受的文档。需求分析就是把总体信息需求、处理需求以及企业自身的制约条件等几方面的因素进行综合考虑,最后规划出一份既切合实际,又具有远见的需求说明书。
需求分析大致分为三步来完成,即需求信息的收集、分析整理和评审。需求信息的收集又称为系统调查,在调查研究之前,要做好充分的准备工作,要明确调查的目的、调查的内容和调查的形式。需求信息的分析整理包括业务流程分析和分析结果的描述,业务流程分析一般采用数据流分析法,分析结果以数据流图(DFD)表示,除了DFD以外,还要用一些规范表格进行补充描述。评审的目的在于确认某一阶段的任务是否全部完成,以避免重大的疏漏或错误。
八、概念设计
概念设计的目标是产生反映企业组织信息需求的数据库概念结构,即概念模式。概念模式是独立于数据库逻辑结构,独立于支持数据库的DBMS,不依赖于计算机系统的。概念设计的必要性表现在:
(1)数据库设计过程中各阶段的任务相对单一化,设计复杂程度大大降低,便于组织管理;
(2)不受特定的DBMS的限制,也独立于存储安排和效率方面的考虑,因而比逻辑模式更为稳定;
(3)概念模式不含具体的DBMS所附加的技术细节,更容易为用户所理解,因而才有可能准确地反映用户的信息要求。
九、逻辑设计
逻辑设计的目的是把概念设计阶段设计好的基本ER图转换为与选用的具体机器上的 DBMS所支持的数据模型相符合的逻辑结构(包括数据库模式和外模式)。这些模式在功能上、完整性和一致性约束及数据库的可扩充性等方面均应满足用户的各种要求。
在逻辑设计阶段主要输入如下信息:
(1)独立于DBMS的概念模式;
(2)处理需求;
(3)约束条件;
(4)DBMS特性。
在逻辑设计阶段主要输出如下信息:
(1)DBMS可处理的模式;
(2)子模式;
(3)应用程序设计指南;
(4)物理设计指南。
逻辑设计的主要步骤有:
(1)初始模式的形成;
(2)子模式设计
(3)应用程序设计梗概;
(4)模式评价;
(5)修正模式。
ER模型中的主要成分是实体类型和联系类型。在ER模型向关系模型转换是时:
(1)实体类型。将每个实体类型转换成一个关系模式,实体的属性即为关系模式的属性,实体标识符为关系模式的键。
(2)联系类型。
①若实体间的联系是1:1的,可以在两个实体类型转换成的两个关系模式中任意一个关系模式的属性中加入另一个关系模式的键和联系类型的属性
②若实体间的联系是1:N的,则在N端实体类型转换成的关系模式中加入1端实体类型转换成的关系模式的键和联系类型的属性;
③若实体间联系是M:N的,则将联系类型也转换成关系模式,其属性为两端实体类型的键加上联系类型的属性,而键为两端实体键的组合。
关系数据库的逻辑设计过程为:
(1)从ER模式导出初始关系模式。
(2)规范化处理:确定规范级别和实施规范化处理。
(3)模式评价:包括功能评价和性能评价。
(4)模式修正:可采用合并、分解或选用另外结构的方式进行。在经过模式评阶及修正的反复多次后,最终的数据库模式得以确定,全局逻辑结构设计即告结束。在逻辑设计阶段,还要设计出全部子模式。
十、物理设计
对一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,称为数据库的物理设计。所谓数据库的物理结构,主要指数据库在物理设备上的存储结构和存取方法。它是完全依赖于给定的计算机系统的。在物理结构中,数据的基本单位是存储记录。“文件”是某一类型的所有存储记录的集合。一般我们用“文件”表示单记录类型的物理数据库。
物理设计可分五步来完成:
(1)存储记录结构设计:包括记录的组成、数据项的类型和长度,以及逻辑记录到存储记录的映射;
(2)确定数据存储安排;
(3)访问方法的设计;
(4)完整性和完全性;
(5)程序设计。
前三步涉及到物理数据库结构的设计,后两步涉及到约束和具体的程序设计。物理设计阶段的输出是物理数据库结构说明书,包括存储记录格式、存储记录位置及访问方法。它能满足所有的操作需求并给出对硬件、软件系统的约束。在设计过程中效率问题只能在各种约束得到满足且获得可行方案之后进行。
十一、实现与维护
在数据的实现与维护阶段,设计人员运用DBMS提供的数据定义语立,将逻辑设计和物理设计的结果严格地描述出来,成为DBMS可接受的源代码,经过调试产生目标模式,然后组织数据入库。实现阶段的主要工作有:
(1)建立实际数据库结构;
(2)试运行;
(3)装人数据。
在数据库正式投入使用之前,还有一些工作要做。如数据库的重新组织设计,故障恢复方案设设计、安全性考虑和事务控制等。
运行维护阶段的主要工作是:
(1)维护数据库的安全性与完整性控制及系统的转储和恢复;
(2)性能的监督、分析与改进;
(3)增加新功能;
(4)发现错误,修改错误
编辑推荐:
下载Word文档

温馨提示:因考试政策、内容不断变化与调整,长理培训网站提供的以上信息仅供参考,如有异议,请考生以权威部门公布的内容为准! (责任编辑:长理培训)
点击加载更多评论>>