关系型数据库范式
㈠ 第一范式第二范式第三范式怎么区分
满足第一范式 就是每个属性都不可在拆分,满足第二范式,非属性值要完全依赖主编码 非码属性不相互依赖,满足第三范式,不存在传递依赖。
㈡ 数据库关系模式有哪些类型
在关系数据库中有型和值两种类型结构。关系模式是型,关系是值,关系模式是对关系的描述。
描述一个关系需要从以下两个方面来定义:第一方面,关系实质上是一个二维表,表的每一行为一个元组,每一列为一个属性。一个元组就是该关系所涉及的属性集的笛卡儿积的一个元素。关系是元组的集合,因此关系模式必须指出这个元组集合的结构,即它由哪些属性构成,这些属性来自哪些域,以及属性与域之间的映象关系。
第二方面,一个关系通常是由赋予它的元组语义来确定的。元组语义实质上是一个n目谓词(n是属性集中属性的个数)。凡使该n目谓词为真的笛卡儿积中的元素(或者说凡符合元组语义的那部分元素)的全体就构成了该关系模式的关系。
1.3.1关系数据库基本概念关系数据中,关系模式涉及众多概念、术语,初学者对这方面不容易把握与理解,以下用通俗易懂的语言来对这些概念及术语作简单的介绍。
1.关系关系(Relation)是指数据库中实体的信息,也就是数据库中二维表的数据。一个关系就是一个数据库表的值,表中的内容是对应关系模式在某个时刻的值,称为一个关系。例如,关系A表示数据库有一张名字为A的数据表所记录的所有数据。关系数据库中每一个关系都具有以下六方面的性质:((1)列是同质的。即每一列中的分量为同一类型的数据,来自同一个域。
(2)不同的列可出自同一个域,称其中的每列为一个属性,不同的属性要给予不同的属性名。
(3)列的顺序无所谓。即列的次序可以任意交换。
(4)任意两个元组不能完全相同。
(5)行的顺序无所谓。即行的次序可以任意交换。
(6)分量必须取原子值。即每一个分量都必须是不可分的数据库属性。
2.模式模式(Schema)是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图,也称逻辑模式。有以下几方面性质:((1)一个数据库只有一个模式。
(2)模式是数据在逻辑级上的视图。
(3)以某一种数据模型为基础。
定义模式时不仅要定义数据的逻辑结构,包括数据项的构成、名字、类型、取值范围等,而且要定义与数据有关的安全性、完整性要求,定义这些数据之间的联系。
3.关系模式关系模式(RelationSchema)描述的是与关系相对应的二维表的表结构,即关系中包含哪些属性,属性来自哪些域,以及与域之间的映象关系。
关系模式与关系的区别:((1)关系模式描述了关系数据结构和语义,是关系的型。而关系是一个数据集合,是关系模式的值,是关系模式的一个实例。
(2)关系实际上就是关系模式在某一时刻的状态或内容。关系模式是静态的、稳定的,而关系是动态的、随时间不断变化的,因为数据库操作会不断地更新数据库中的数据。
4.元组元组(Tuple)是关系数据库中的基本概念,一个关系表中的每行就是一个元组。也就是说数据库表中的每条记录都是一个元组,表结构的每列就是一个属性,在二维表里,元组也称为记录。元组可表示一个关系或关系之间的联系。
一般情况下,一个关系数据表中的每条记录均有一个唯一的编号(记录号),这个编号也叫元组号。
5.码码(Key)是关系数据库系统中的基本概念。所谓码,就是能唯一标识实体的属性集,是整个属性集,而不是单个属性。在关系数据库中,码包括多种类型,如超码、候选码和主码。
((1)超码(SuperKey)。超码是一个或多个属性的集合,这些属性可以在一个实体集中唯一地标识一个实体。如果K是一个超码,那么K的任意超集也是超码,也就是说如果K是超码,那么所有包含K的集合也是超码。例如,学生是一个实体,则学生的集合是一个实体集,而超码用来在学生的集合中区分不同的学生。假设学生(实体)具有多个属性:学号,身份证号,姓名,性别。因为通过学号可以找到唯一一个学生,所以{学号}是一个超码,同理{学号,身份证号}、{学号,身份证号,姓名}、{学号,身份证号,姓名,性别}、{身份证号}、{身份证号,姓名}、{身份证号,姓名,性别}也是超码。在这里,因为不同的学生可能拥有相同的姓名,所以姓名不可以区别一个学生,即{姓名}不是一个超码,{性别}、{姓名,性别}也不是。
(2)候选码(CandidateKey)。候选码是可以唯一标识一个元组的最少的属性集合。候选码是从超码中选出的,因此候选码也是一个或多个属性的集合。因为超码的范围太广,很多是无用的,所以候选码是最小超码,它们的任意真子集都不能成为超码。例如,如果K是超码,那么所有包含K的集合都不能是候选码;如果K,J都不是超码,那么K和J组成的集合{K,J}有可能是候选码。
虽然超码可以唯一标识一个实体,但是可能大多数超码中含有多余的属性,所以需要候选码。
例如学生表,学生(学号,姓名,年龄,性别,专业),其中的学号是可以唯一标识一个元组,所以学号可以作为候选码。既然学号都可以作候选码,那么学号和姓名这两个属性的组合就可以唯一区别一个元组。此时的学号可以成为码,学号和姓名的组合也可以成为码,但是学号和姓名的组合不能成为候选码,因为即使去掉姓名属性,剩下的学号属性也完全可以唯一地标识一个元组。也就是说,候选码中的所有属性都是必需的,缺少任何一个属性,都不能唯一标识一个元组。
(3)主码(PrimaryKey)。主码是从多个候选码中任意选出一个作为主键,这个被选中的候选码就称为主码。如果候选码只有一个,那么候选码就是主码。虽然说主码的选择是比较随意的,但在实际开发中还是需要一定的经验,不然开发出来的系统会出现问题。一般来说,主码都应该选择那些从不或者极少变化的属性。
例如,在一个职工实体中,职工(职工号,姓名,入职时间,部门,岗位,工资,职级,工龄,电话),职工号可以用来唯一确定实体中的一个元组,所以职工号是一个候选码。如果实体属性——姓名、入职时间、部门三者组合也能唯一地确定一个元组,则(姓名,入职时间,部门)也是一个候选码。在上述两个候选码中任选一个均可作为职工实体的主码,一般来说直接选择职工号作为实体的主码是最为简单方便的。
1.3.2关系模式的定义关系是数据库二维表中的数据记录,关系模式是数据库二维表的表结构,关系是动态的,关系模式是静态的。
关系模式可由六个元素来描述,分别是R、U、D、dom、I、F。其中,R为关系的名称;
U为组成该关系的属性名的集合;D为U集合中属性的域集合;dom为属性集U向域集D的映射;I为完整约束集合;F为属性间数据的依赖关系集合。
一个关系模式通常表示为R(U,D,dom,I,F),也可以忽略其他元素,直接简化为R(U)或R(A1,A2,A3,…,An),其中A1,A2,A3,…,An为属性名。
例如,在一个选课模块中,包含“学生”“课程”“选修”等关系实体。“学生”实体的属性有SNO(学号)、SNAME(姓名)、AGE(年龄)、SEX(性别)、SDEPT(系部),其中“学号”为主键;“课程”实体的属性有CNO(课程号)、CNAME(课程名称)、CDEPT(系部)、TNAME(教师),其中“课程号”为主键;“选修”实体的属性有GRADE(成绩)、SNO(学号)、CNO(课程号),其中“学号”和“课程号”为联合主键。学生和课程之间是多对多的关联关系,即一个学生可以同时选修多门课程,一门课程也可以同时被多个学生选修。这种多对多的关联关系可以通过“选修”关系实体作为中间桥接实体,变成两个一对多的实体关联关系,如图所示。
图学生选课实体
从图的实体关系图中可以得到选课模块的实体关系模式集——学生关系、课程关系、选修关系,具体关系模式如下:学生关系模式Student(SNO,SNAME,AGE,SEX,SDEPT);
课程关系模式Course(CNO,CNAME,CDEPT,TNAME);
选修关系模式StudentCourse(SNO,CNO,GRADE)。
对以上定义的三个关系模式实例化,插入初始化数据后,可得到学生、课程、选修三个关系的实例,如图所示。图中矩形框圈住部分为选课模块中的关系模式(表结构);椭圆框圈住部分为选课模块中的关系(数据)。整个选课模块的表环境由关系模式与关系两部分共同组成,缺一不可。关系模式的分解标准关系模式的规范化过程实际上就是关系模式的“分解”过程,即把逻辑上独立的信息放在独立的关系模式中。分解是解决数据冗余的主要方法,也是规范化的一条原则——关系模式有冗余问题就要分解。
数据库设计者在进行关系数据库设计时,应参照模式规范化理论,尽可能使数据库模式保持高的标准。一般尽量把关系数据库设计成巴斯−科德范式(BCNF)的模式集,如果设计成巴斯−科德范式(BCNF)模式集时达不到保持函数依赖的标准,那么只能降低要求,设计成第三范式(3NF)的模式集,以达到保持函数依赖和无损分解的基本要求。
学生、课程、选修三个关系的实例
1.分解的定义一个关系模式可以分解成众多子关系模式,分解方式不同,得到的子关系模式也不同。
关系模式的分解是指把某一个关系模式按照某一种方式进行分解得到的所有子关系模式。
如关系模式R按照某一种方式分解,可以得到一个关系集ρ={R1
函数依赖关系集F=F1∪F2∪…∪Fn,其中F1,F2,…,Fn是F在U1,U2,…,Un上的投影。
2.分解的标准把低级的关系模式分解成高级的关系模式的方法不是唯一的,只要能够保证分解后的关系模式与原关系模式等价,就是一个完整、标准的分解方法。关系模式的标准分解方法应同时达到以下两方面的要求:((1)分解具有无损连接性。
(2)分解要保持函数依赖性。
具有无损连接性的分解保证信息不会丢失,但无损连接不一定能解决插入异常、删除异常、修改复杂、数据冗余等问题,如要解决这些问题,则要考虑更高的关系数据范式理论原则。
㈢ 数据库的三大范式
1、第一范式(1NF)
所谓第一范式(1NF)是指在关系模型中,对于添加的一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项。
即实体中的某个属性有多个值时,必须拆分为不同的属性。在符合第一范式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。简而言之,第一范式就是无重复的域。
说明:在任何一个关系数据库中,第一范式(1NF)是对关系模式的设计基本要求,一般设计中都必须满足第一范式(1NF)。
不过有些关系模型中突破了1NF的限制,这种称为非1NF的关系模型。换句话说,是否必须满足1NF的最低要求,主要依赖于所使用的关系模型。
2、第二范式(2NF)
在1NF的基础上,非码属性必须完全依赖于候选码(在1NF基础上消除非主属性对主码的部分函数依赖)
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。
第二范式(2NF)要求数据库表中的每个实例或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组,作为实体的唯一标识。
例如在员工表中的身份证号码即可实现每个一员工的区分,该身份证号码即为候选键,任何一个候选键都可以被选作主键。
在找不到候选键时,可额外增加属性以实现区分,如果在员工关系中,没有对其身份证号进行存储,而姓名可能会在数据库运行的某个时间重复。
无法区分出实体时,设计辟如ID等不重复的编号以实现区分,被添加的编号或ID选作主键。(该主键的添加是在ER设计时添加,不是建库时随意添加)
第二范式(2NF)要求实体的属性完全依赖于主关键字。
所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。
为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。简而言之,第二范式就是在第一范式的基础上属性完全依赖于主键。
3、第三范式(3NF)
在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
第三范式(3NF)是第二范式(2NF)的一个子集,即满足第三范式(3NF)必须满足第二范式(2NF)。
简而言之,第三范式(3NF)要求一个关系中不包含已在其它关系已包含的非主关键字信息。例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。
那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。
如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。
简而言之,第三范式就是属性不依赖于其它非主属性,也就是在满足2NF的基础上,任何非主属性不得传递依赖于主属性。
(3)关系型数据库范式扩展阅读
设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。
目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。
满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多规范要求的称为第二范式(2NF),其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。
参考资料:网络-数据库范式
㈣ 求解答数据库范式
第一范式(1NF)
所谓第一范式(1NF)是指在关系模型中,对于添加的一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项。即实体中的某个属性有多个值时,必须拆分为不同的属性。在符合第一范式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。简而言之,第一范式就是无重复的域。
说明:在任何一个关系数据库中,第一范式(1NF)是对关系模式的设计基本要求,一般设计中都必须满足第一范式(1NF)。不过有些关系模型中突破了1NF的限制,这种称为非1NF的关系模型。换句话说,是否必须满足1NF的最低要求,主要依赖于所使用的关系模型。
第二范式(2NF)
在1NF的基础上,非码属性必须完全依赖于候选码(在1NF基础上消除非主属性对主码的部分函数依赖)
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组,作为实体的唯一标识。例如在员工表中的身份证号码即可实现每个一员工的区分,该身份证号码即为候选键,任何一个候选键都可以被选作主键。在找不到候选键时,可额外增加属性以实现区分,如果在员工关系中,没有对其身份证号进行存储,而姓名可能会在数据库运行的某个时间重复,无法区分出实体时,设计辟如ID等不重复的编号以实现区分,被添加的编号或ID选作主键。(该主键的添加是在ER设计时添加,不是建库时随意添加)
第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。简而言之,第二范式就是在第一范式的基础上属性完全依赖于主键。
第三范式(3NF)
在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
第三范式(3NF)是第二范式(2NF)的一个子集,即满足第三范式(3NF)必须满足第二范式(2NF)。简而言之,第三范式(3NF)要求一个关系中不包含已在其它关系已包含的非主关键字信息。例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三范式就是属性不依赖于其它非主属性,也就是在满足2NF的基础上,任何非主属性不得传递依赖于主属性。
巴斯-科德范式(BCNF)
Boyce-Codd Normal Form(巴斯-科德范式)
在3NF基础上,任何非主属性不能对主键子集依赖(在3NF基础上消除对主码子集的依赖)
巴斯-科德范式(BCNF)是第三范式(3NF)的一个子集,即满足巴斯-科德范式(BCNF)必须满足第三范式(3NF)。通常情况下,巴斯-科德范式被认为没有新的设计规范加入,只是对第二范式与第三范式中设计规范要求更强,因而被认为是修正第三范式,也就是说,它事实上是对第三范式的修正,使数据库冗余度更小。这也是BCNF不被称为第四范式的原因。某些书上,根据范式要求的递增性将其称之为第四范式是不规范,也是更让人不容易理解的地方。而真正的第四范式,则是在设计规范中添加了对多值及依赖的要求。
定义:关系模式R<U,F>∈1FNF,若X→Y且Y不是X的子集时X必含有码,则R<U,F>∈BCNF。也就是说,关系模式R<U,F>中,若每一个决定因素都包含码,则R<U,F>∈BCNF。
由BCNF的定义可以得到结论,一个满足BCNF的关系模式有:
-所有非主属性对每一个码都是完全函数依赖。
-所有主属性对每一个不包含它的码也是完全函数依赖。
-没有任何属性完全函数依赖于非码的任何一组属性。
若R∈BCNF,按定义排除了任何属性对码的传递依赖与部分依赖,所以R∈3NF。[1]
一般关系型数据库设计中,达到BCNF就可以了!
㈤ 什么是数据库中的“范式”
设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。
目前关系数据库有六种范式,但数据库必须遵守1、2、3
范式。
第一范式(1NF)、第二范式(2NF)、第三范式(3NF)。
其它的你可以到网上搜索一下
㈥ 数据库有几种范式
目前关系数据库有六种范式,即第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯−科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多规范要求的称为第二范式(2NF),其余范式依次类推。一般来说,数据库只需满足第三范式(3NF)。
第一范式(1NF)第一范式(1NF)是指在关系模型中,对域添加的一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不是集合、数组、记录等非原子数据项。即实体中的某个属性有多个值时,必须拆分为不同的属性。在符合第一范式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。
简而言之,第一范式(1NF)是最基本的范式,如果数据库表中的所有字段值都是不可分解的原子值,就说明该数据库表满足第一范式(1NF)。在任何一个关系数据库中,第一范式(1NF)是对关系模式设计的基本要求,所有设计的数据模型都必须满足第一范式(1NF)。
从上面的定义描述中,可以归纳出第一范式(1NF)具有如下几个显着特点:((1)数据库表中的字段都是单一属性。
①字段不可再分。
②同一列中不能有多个值。
(2)单一属性由基本类型构成。
①整型。
②实数。
③字符型。
④逻辑型。
⑤日期型。
⑥其他类型。
满足以上两大特征的表就是符合第一范式(1NF)的表,不满足以上任一特征的表都是不符合第一范式(1NF)的表。
例如,图字段可再分的表所示的“电话”字段可以再拆分成“手机”与“座机”字段,不满足“字段不可再分”的要求,因此不符合第一范式(1NF)要求。
字段可再分的表
又如,图字段可再分的表所示的“姓名”字段包含“张伟”与“宋鑫”两个值,不满足“同一列中不能有多个值”的要求,因此也不符合第一范式(1NF)要求。
同一列中有多个值的表
第二范式(2NF)第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组,作为实体的唯一标识。例如,员工表中的身份证号码即可实现每个员工的区分,该身份证号码即候选键,任何一个候选键都可以被选作主键。在找不到候选键时,可额外增加属性以实现区分。如果在员工关系中没有对其身份证号码进行存储,而姓名可能会在数据库运行的某个时间重复,无法区分出实体时,设计身份证号码等不重复的编号以实现区分,被添加的编号选作主键。注意:该主键的添加是在ER设计时添加,不是在建库时随意添加。
第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖,是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分,通常需要为表加上一个列,以存储各个实例的唯一标识。
简而言之,第二范式(2NF)在第一范式(1NF)的基础之上更进一层。第二范式(2NF)需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。也就是说在一个数据库表中,一个表中只能保存一种数据,不可以把多种数据保存在同一个数据库表中。
所谓联合主键,是指由两个或两个以上的字段共同组成数据表的主键。如图联合主键表所示,单凭“客户”字段无法确定表中唯一的记录,单凭“开户银行”字段也无法确定表中唯一的与“开户银行”一起组成数据表的联合主键。
联合主键表
从上面的定义描述中,可以归纳出第二范式(2NF)具有如下几个显着特点:((1)数据库表满足第一范式(1NF)。
(2)数据库中每个表均有主键。
①单字段主键。
②联合主键。即不能存在单个主键字段决定非主键字段的情况。
例如,表中有A、B、C、D、E五个字段,若A与B为联合主键(A,B),如有A决定C的情况(A→C),则不符合第二范式(2NF)。
满足以上特征的表就是符合第二范式(2NF)的表,不满足以上任何一特征的表都是不符合第二范式(2NF)的表。
例如,如图所示,所有字段均不可再拆分,因而满足第一范式(1NF)的要求,但表中没有任何一个字段可以确定表中的唯一记录,即表中没有主键,因此其不满足“数据库中每张表均有主键”的要求,所以不符合第二范式(2NF)要求。
又如,如图所示,满足第一范式(1NF)的要求,并且在原来的基础上增加了“ID”字段作为表的主键,因此其符合第二范式(2NF)要求。
没有主键的数据表
增加了主键的数据表
重新分析图1−3所示的联合主键表,此表符合第一范式(1NF)“字段不可再拆分”的要求,并且有“客户”与“开户银行”两个字段作为表的联合主键(客户,开户银行),但其是否就是一个符合第二范式(2NF)的表呢?
进一步分析,就可以发现:“客户电话”字段由“客户”字段决定,“开户行地址”字段由“开户银行”字段决定;即存在如下依赖关系:客户→客户电话,开户银行→开户行地址。
(客户,开户银行)为主键字段,(客户电话,开户行地址)为非主键字段,因此,其不符合联合主键中“不能存在单个主键字段决定非主键字段”的情况,所以可以认定其并不是符合第二范式(2NF)的数据表。
例1.1判断如图所示的学生信息表是否符合第二范式(2NF)。
图所示中存在联合主键(学号,课程编号),但存在(学号→姓名)、(课程编号→课程名)的依赖关系,即存在某个主键字段决定非主键字段的情况,因此其不符合第二范式(2NF),不是第二范式(2NF)表。可考虑把此表拆成分数表(见图)、课程表(见图)和姓名表(见图),则此三个表是符合第二范式(2NF)的表。
图学生信息表
图分数表
图课程表
图姓名表
第三范式(3NF)第三范式(3NF)是第二范式(2NF)的一个子集,即满足第三范式(3NF)必须满足第二范式(2NF)。第三范式(3NF)要求一个关系中不包含已在其他关系包含的非主关键字信息。
第三范式(3NF)就是任何非主属性不依赖于其他非主属性,也就是在满足第二范式(2NF)的基础上,任何非主属性不得传递依赖于主属性。第三范式(3NF)需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。数据不能存在传递关系,即每个属性都跟主键有直接关系而不是间接关系。如属性之间含有A→B→C这样的关系,是不符合第三范式(3NF)的。
当数据表不符合第三范式(3NF)时,会有大量的冗余数据,还会存在插入异常、删除异常、数据冗余度大、修改复杂等问题。
从上面的定义描述中,可以归纳出第三范式(3NF)具有如下几个显着特点:((1)数据库表满足第二范式。
(2)数据库表的非主键字段不存在传递依赖关系(即非主键字段不能决定其他非主键字段)。例如,表中有A、B、C、D、E五个字段,若A为主键,如有C决定D的情况(C→D)则不符合第三范式(3NF)。
满足以上特征的表就是符合第三范式(3NF)的表,不满足以上任何一特征的表都是不符合第三范式(3NF)的表。
如图所示,表中有主键(工号),因而满足第二范式(2NF)的要求;但表中非主键字段间存在传递依赖关系:非主键字段“部门”决定非主键字段“部门电话”和“部门主管”(部门→部门电话,部门→部门主管),因此不符合第三范式(3NF)的要求。
图非主键字段存在传递依赖关系的表
例1.2判断图所示的学生院属信息表是否符合第三范式(3NF)。
图学生院属信息表
图中有主键(学号),则满足第二范式(2NF)的要求,但存在(所在学院→学院电话)、(所在学院→学院地点),即存在非主键字段决定其他非主键字段的情况,因此其不符合第三范式(3NF)的要求,不是第三范式(3NF)表。可考虑把此表拆成学生表(见图)和学院表(见图),则两个表是符合第三范式(3NF)的表。
图学生表
图学院表
㈦ 创建关系型数据库有几种范式并详述各个范式之间的递进关系
第一范式(1NF):每一个属性都是原子项,不可分割
INF中所述的不可分割,是指在可分割的情况下必须分割,这是在应用环境中来判断的,当属性是文档时,虽然文档有段落标记,但还是不应该分割。
第二范式:每个非主属性要完全函数依赖于候选键,或者是主键。
关键词是“完全依赖”,与“部分依赖”或“局部依赖”相对,如果候选键或主键由两个属性组成,非主属性不能只依赖与其中一个或部分属性。
比如:股票日行情表由股票代码、股票名称、日期、收盘价四个属性组成,这就违反了2NF,因为“股票名称”部分依赖于“股票代码”。
第三范式:所有非主属性对任何候选关键字都不存在传递依赖
关键词是“传递依赖”,如果非主属性通过另一个非主属性依赖主键,则是传递依赖。
比如:股票基本信息表由股票代码、股票名称、企业名称、所在地区、所在省份组成,其中“所在省份”依赖于所在地区,存在传递依赖。
-----------------------------------
几个相关术语:
超键(super key):在关系中能唯一标识元组的属性集称为关系模式的超键
候选键(candidate key):不含有多余属性的超键称为候选键
主键(primary key):用户选作元组标识的一个候选键称为主键
主属性(Prime Attribute):候选键中的属性称为主属性
非主属性(Non-Key Attribute):不包含在任何候选键中的属性称为非主属性。
㈧ 什么是数据库三大范式
什么是范式:简言之就是,数据库设计对数据的存储性能,还有开发人员对数据的操作都有莫大的关系。所以建立科学的,规范的的数据库是需要满足一些
规范的来优化数据数据存储方式。在关系型数据库中这些规范就可以称为范式。
什么是三大范式:
第一范式:当关系模式R的所有属性都不能在分解为更基本的数据单位时,称R是满足第一范式的,简记为1NF。满足第一范式是关系模式规范化的最低要
求,否则,将有很多基本操作在这样的关系模式中实现不了。
第二范式:如果关系模式R满足第一范式,并且R得所有非主属性都完全依赖于R的每一个候选关键属性,称R满足第二范式,简记为2NF。
第三范式:设R是一个满足第一范式条件的关系模式,X是R的任意属性集,如果X非传递依赖于R的任意一个候选关键字,称R满足第三范式,简记为3NF。
㈨ 怎样区分关系数据库中的六个范式
这六个范式是逐步加强,数据库设计时,满足的范式越高,理论上讲,数据冗余就越少,并且越不容易出问题。。。实际上嘛。。就不说了。。总之,一般设计数据库时要求满足第三范式第一范式的意思就是每列都不可再分,且每个表中的每列都是不重复的,只有满足了第一范式才叫关系型数据库。先满足第一范式才能满足第二范式,第二范式的意思是表中的每行必须唯一,也就是说,要有能唯一标识每行的列(或几个列也行)满足第二范式才能满足第三范式,第三范式是的意思是要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。鲍依斯-科得范式,也就是BC范式,在第三范式的基础上,消除传递依赖(传递依赖。。这个还有个定义问题:比如A->B,B->C,则A与C之间的依赖就是传递依赖)第四范式,(不废话了,反正前提是先满足前一个范式,下面也一样),消除多值依赖(多值依赖就是存在一对多的关系,间接和直接的都可能有)第五范式,这个就比较扯了,细分成第四范式以后表已经很碎了,第五范式还要求更碎。。。第五范式的目标还是消除多值依赖,不过所消除多值依赖的更难以发现,官方的说法是:保证在第四范式中存在的任何可以分解为实体的三元关系都被分解。 晕不?
㈩ 数据库范式是什么
范式是指符合某一种级别的关系模式的集合,关系数据库中的关系必须满足一定的要求,满足不同程度要求的为不同的范式。简而言之,范式是为了消除重复数据来减少冗余数据,从而让数据库内的数据更好地组织,让磁盘空间得到更有效利用的一种标准化准则。
数据库设计对数据的存储性能,以及开发人员对数据的操作都有很大的关系,所以建立科学的、规范的数据库必须满足相关的规范准则是至关重要的。设计关系数据库时,应遵从不同的规范要求设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式。各种范式呈递次规范,越高等级的范式数据库冗余越小,满足高等级范式的先决条件是先满足低等级范式。
应用数据库范式有许多优点,但是主要优点有:((1)可以减少数据冗余,这是最重要的优点。
(2)可以消除异常,如插入异常、更新异常、删除异常等。
(3)可以让数据组织得更加和谐、合理、高效。
满足数据库设计范式规范的数据库是简洁的、结构明晰的;同时,不会发生插入(Insert)、删除(Delete)和更新(Update)操作异常。反之,不仅给数据库的编程人员带来麻烦,而且存储了大量的冗余信息。