数据库第四范式
⑴ 数据库三大范式通俗理解是什么
在关系数据库中,这种规则就是范式。关系数据库中的关系必须满足一定的要求,即满足不同的范式。目前关系数据库有六种范式:
第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、第四范式(4NF)、第五范式(5NF)和第六范式(6NF)。满足最低要求的范式是第一范式(1NF)。
在第一范式的基础上进一步满足更多要求的称为第二范式(2NF),其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。下面我们举例介绍第一范式(1NF)、第二范式(2NF)和第三范式(3NF)。
(1)数据库第四范式扩展阅读:
规范化目的是使结构更合理,消除存储异常,使数据冗余尽量小。便于插入、删除和更新。
遵从概念单一化“一事一地”原则,即一个关系模式描述一个实体或实体间的一种联系。规范的实质就是概念的单一化。
一个关系模式接着分解可以得到不同关系模式集合,也就是说分解方法不是惟一的。最小冗余的要求必须以分解后的数据库能够表达原来数据库所有信息为前提来实现。其根本目标是节省存储空问,避免数据不一致性,提高对关系的操作效率,同时满足应用需求。
⑵ 数据库有几种范式
目前关系数据库有六种范式,即第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯−科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多规范要求的称为第二范式(2NF),其余范式依次类推。一般来说,数据库只需满足第三范式(3NF)。
第一范式(1NF)第一范式(1NF)是指在关系模型中,对域添加的一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不是集合、数组、记录等非原子数据项。即实体中的某个属性有多个值时,必须拆分为不同的属性。在符合第一范式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。
简而言之,第一范式(1NF)是最基本的范式,如果数据库表中的所有字段值都是不可分解的原子值,就说明该数据库表满足第一范式(1NF)。在任何一个关系数据库中,第一范式(1NF)是对关系模式设计的基本要求,所有设计的数据模型都必须满足第一范式(1NF)。
从上面的定义描述中,可以归纳出第一范式(1NF)具有如下几个显着特点:((1)数据库表中的字段都是单一属性。
①字段不可再分。
②同一列中不能有多个值。
(2)单一属性由基本类型构成。
①整型。
②实数。
③字符型。
④逻辑型。
⑤日期型。
⑥其他类型。
满足以上两大特征的表就是符合第一范式(1NF)的表,不满足以上任一特征的表都是不符合第一范式(1NF)的表。
例如,图字段可再分的表所示的“电话”字段可以再拆分成“手机”与“座机”字段,不满足“字段不可再分”的要求,因此不符合第一范式(1NF)要求。
字段可再分的表
又如,图字段可再分的表所示的“姓名”字段包含“张伟”与“宋鑫”两个值,不满足“同一列中不能有多个值”的要求,因此也不符合第一范式(1NF)要求。
同一列中有多个值的表
第二范式(2NF)第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组,作为实体的唯一标识。例如,员工表中的身份证号码即可实现每个员工的区分,该身份证号码即候选键,任何一个候选键都可以被选作主键。在找不到候选键时,可额外增加属性以实现区分。如果在员工关系中没有对其身份证号码进行存储,而姓名可能会在数据库运行的某个时间重复,无法区分出实体时,设计身份证号码等不重复的编号以实现区分,被添加的编号选作主键。注意:该主键的添加是在ER设计时添加,不是在建库时随意添加。
第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖,是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分,通常需要为表加上一个列,以存储各个实例的唯一标识。
简而言之,第二范式(2NF)在第一范式(1NF)的基础之上更进一层。第二范式(2NF)需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。也就是说在一个数据库表中,一个表中只能保存一种数据,不可以把多种数据保存在同一个数据库表中。
所谓联合主键,是指由两个或两个以上的字段共同组成数据表的主键。如图联合主键表所示,单凭“客户”字段无法确定表中唯一的记录,单凭“开户银行”字段也无法确定表中唯一的与“开户银行”一起组成数据表的联合主键。
联合主键表
从上面的定义描述中,可以归纳出第二范式(2NF)具有如下几个显着特点:((1)数据库表满足第一范式(1NF)。
(2)数据库中每个表均有主键。
①单字段主键。
②联合主键。即不能存在单个主键字段决定非主键字段的情况。
例如,表中有A、B、C、D、E五个字段,若A与B为联合主键(A,B),如有A决定C的情况(A→C),则不符合第二范式(2NF)。
满足以上特征的表就是符合第二范式(2NF)的表,不满足以上任何一特征的表都是不符合第二范式(2NF)的表。
例如,如图所示,所有字段均不可再拆分,因而满足第一范式(1NF)的要求,但表中没有任何一个字段可以确定表中的唯一记录,即表中没有主键,因此其不满足“数据库中每张表均有主键”的要求,所以不符合第二范式(2NF)要求。
又如,如图所示,满足第一范式(1NF)的要求,并且在原来的基础上增加了“ID”字段作为表的主键,因此其符合第二范式(2NF)要求。
没有主键的数据表
增加了主键的数据表
重新分析图1−3所示的联合主键表,此表符合第一范式(1NF)“字段不可再拆分”的要求,并且有“客户”与“开户银行”两个字段作为表的联合主键(客户,开户银行),但其是否就是一个符合第二范式(2NF)的表呢?
进一步分析,就可以发现:“客户电话”字段由“客户”字段决定,“开户行地址”字段由“开户银行”字段决定;即存在如下依赖关系:客户→客户电话,开户银行→开户行地址。
(客户,开户银行)为主键字段,(客户电话,开户行地址)为非主键字段,因此,其不符合联合主键中“不能存在单个主键字段决定非主键字段”的情况,所以可以认定其并不是符合第二范式(2NF)的数据表。
例1.1判断如图所示的学生信息表是否符合第二范式(2NF)。
图所示中存在联合主键(学号,课程编号),但存在(学号→姓名)、(课程编号→课程名)的依赖关系,即存在某个主键字段决定非主键字段的情况,因此其不符合第二范式(2NF),不是第二范式(2NF)表。可考虑把此表拆成分数表(见图)、课程表(见图)和姓名表(见图),则此三个表是符合第二范式(2NF)的表。
图学生信息表
图分数表
图课程表
图姓名表
第三范式(3NF)第三范式(3NF)是第二范式(2NF)的一个子集,即满足第三范式(3NF)必须满足第二范式(2NF)。第三范式(3NF)要求一个关系中不包含已在其他关系包含的非主关键字信息。
第三范式(3NF)就是任何非主属性不依赖于其他非主属性,也就是在满足第二范式(2NF)的基础上,任何非主属性不得传递依赖于主属性。第三范式(3NF)需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。数据不能存在传递关系,即每个属性都跟主键有直接关系而不是间接关系。如属性之间含有A→B→C这样的关系,是不符合第三范式(3NF)的。
当数据表不符合第三范式(3NF)时,会有大量的冗余数据,还会存在插入异常、删除异常、数据冗余度大、修改复杂等问题。
从上面的定义描述中,可以归纳出第三范式(3NF)具有如下几个显着特点:((1)数据库表满足第二范式。
(2)数据库表的非主键字段不存在传递依赖关系(即非主键字段不能决定其他非主键字段)。例如,表中有A、B、C、D、E五个字段,若A为主键,如有C决定D的情况(C→D)则不符合第三范式(3NF)。
满足以上特征的表就是符合第三范式(3NF)的表,不满足以上任何一特征的表都是不符合第三范式(3NF)的表。
如图所示,表中有主键(工号),因而满足第二范式(2NF)的要求;但表中非主键字段间存在传递依赖关系:非主键字段“部门”决定非主键字段“部门电话”和“部门主管”(部门→部门电话,部门→部门主管),因此不符合第三范式(3NF)的要求。
图非主键字段存在传递依赖关系的表
例1.2判断图所示的学生院属信息表是否符合第三范式(3NF)。
图学生院属信息表
图中有主键(学号),则满足第二范式(2NF)的要求,但存在(所在学院→学院电话)、(所在学院→学院地点),即存在非主键字段决定其他非主键字段的情况,因此其不符合第三范式(3NF)的要求,不是第三范式(3NF)表。可考虑把此表拆成学生表(见图)和学院表(见图),则两个表是符合第三范式(3NF)的表。
图学生表
图学院表
⑶ 数据库五大范式是什么
第一范式(1NF)
在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。
所谓第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。如果出现重复的属性,就可能需要定义一个新的实体,新的实体由重复的属性构成,新实体与原实体之间为一对多关系。在第一范式(1NF)中表的每一行只包含一个实例的信息。例如,对于图3-2 中的员工信息表,不能将员工信息都放在一列中显示,也不能将其中的两列或多列在一列中显示;员工信息表的每一行只表示一个员工的信息,一个员工的信息在表中只出现一次。简而言之,第一范式就是无重复的列。 3.4.2 第二范式(2NF)
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或行必须可以被惟一地区分。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。如
图3-2 员工信息表中加上了员工编号(emp_id)列,因为每个员工的员工编号是惟一的,因此每个员工可以被惟一区分。这个惟一属性列被称为主关键字或主键、主码。
第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。简而言之,第二范式就是非主属性非部分依赖于主关键字。
3.4.3 第三范式(3NF)
满足第三范式(3NF)必须先满足第二范式(2NF)。简而言之,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那么在图3-2
的员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三范式就是属性不依赖于其它非主属性。
⑷ 数据库(mysql)关键知识
Mysql是目前互联网使用最广的关系数据库,关系数据库的本质是将问题分解为多个分类然后通过关系来查询。 一个经典的问题是用户借书,三张表,一个用户,一个书,一个借书的关系表。当需要查询某个用户借书情况或者是书被那些人借了,就用关系查询来实现。
关系数据库范式
来自英文Normal form,简称NF。要想设计—个好的关系,必须使关系满足一定的约束条件,满足这些规范的数据库是简洁的、结构明晰的,同时,不会发生插入(insert)、删除(delete)和更新(update)操作异常。总共有六种范式:第一范式(1NF)、第二范式(2NF)、 第三范式 (3NF)、巴斯-科德范式(BCNF)、 第四范式 (4NF)和 第五范式 (5NF,又称完美范式)。
1NF是指数据库表的每一列都是不可分割的原子数据项。2NF必须满足1NF,要求数据库表中的每行记录必须可以被唯一地区分。3NF在2NF基础上,任何非主 属性 不依赖于其它非主属性(在2NF基础上消除传递依赖)。BCNF是在3NF基础上,任何非主属性不能对主键子集依赖(在3NF基础上消除对主码子集的依赖), 满足BCNF不再会有任何由于函数依赖导致的异常,但是我们还可能会遇到由于多值依赖导致的异常。4NF的定义很简单:已经是BC范式,并且不包含多值依赖关系。5NF处理的是无损连接问题,这个范式基本没有实际意义,因为无损连接很少出现,而且难以察觉。而域键范式试图定义一个终极范式,该范式考虑所有的依赖和约束类型,但是实用价值也是最小的,只存在理论研究中。
Catalog和Schema
是数据库对象命名空间中的层次,主要用来解决命名冲突的问题。从概念上说,一个数据库系统包含多个Catalog,每个Catalog又包含多个Schema,而每个Schema又包含多个数据库对象(表、视图、字段等)。但是Mysql的数据库名就是Schema,不支持Catalog。
Mysql的数据库引擎主要有两种MyISAM和InnoDB,MyISAM支持全文检索,InnoDB支持事务。
SQL中的通配符‘%’代表任意字符出现任意次数。‘_’代表任意字符出现一次。SQL与正则表达式结合查询一般用在WHERE table_name REGEXP '^12.34'。子查询是从里到外执行。
数据库联结(join)涉及到外键,外键是指一个表的列是另一个表的主键,那么它就是外键。笛卡尔积联结(不指定联结条件时)生成的记录条目是单纯的第一个表的行乘以第二个表的列数。用得最多的是等值联结也叫内部联结。
高级联结还有自连接,是指查询中的两张表是同一张表,它通常作为外部语句用来代替从相同表中检索数据时使用的子查询。自然联结使每个列只返回一次。外部联结是指联结包含了那些在相关表中没有关联行的行。例如列出所有产品及其订购数量,包括没有人订购的产品。LEFT OUTER JOIN指选择左边表的所有行。
组合查询是指采用UNION等将两个查询结果取并集。
视图是查看存储在别处的数据的一种工具,它本身并不包含数据,因此表的数据修改了,视图返回的数据也将随之修改,因此如果使用了复杂或嵌套视图会对性能有较大的影响。视图的作用之一是隐藏复杂的SQL通常会涉及到联结查询。
存储过程类似于批处理,包含了一条或多条SQL语句。语法:
CREATE PROCEDURE name()
BEGIN
SQL
END
-------------------------
CALL name()//来调用存储过程
游标有DECLARE定义,游标与存储过程是绑定的,存储过程处理完成,游标就会消失。游标被打开后可以使用FETCH语句访问每一行。
触发器是在某个时间发生时自动执行某条SQL语句。语法:
CREATE TRIGGER name AFTER INSERT ON talbe_name FOR EACH ROW
事务处理可以维护数据库的完整性,保证批量的操作要么完全执行,要么完全不执行。包括事务、回退、提交、保留点几个关键术语。ROLLBACK只能在一个事务处理内使用。他不能回退CREATE和DROP操作。使用COMMIT保证事务提交。复杂的事务处理需要部分提交或回退,因此我们需要使用保留点SAVEPOINT。可以使用ROLLBACK TO savepoint_name。保留点越多越好。保留点在事务执行完成后自动释放。
⑸ 数据库中的1NF、2NF、3NF、BCNF、4NF、5NF是怎么回事
范式,一般意义上是指关系数据库的设计范式
设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。
目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴德斯科范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。
满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多规范要求的称为第二范式(2NF),其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。
第一范式(1NF)无重复的列所谓第一范式(1NF)是指在关系模型中,对域添加的一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项。即实体中的某个属性有多个值时,必须拆分为不同的属性。在符合第一范式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。简而言之,第一范式就是无重复的域。
说明:在任何一个关系数据库中,第一范式(1NF)是对关系模式的设计基本要求,一般设计中都必须满足第一范式(1NF)。不过有些关系模型中突破了1NF的限制,这种称为非1NF的关系模型。换句话说,是否必须满足1NF的最低要求,主要依赖于所使用的关系模型。第二范式(2NF)属性在1NF的基础上,非码属性必须完全依赖于码[在1NF基础上消除非主属性对主码的部分函数依赖]
第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组,作为实体的唯一标识。例如在员工表中的身份证号码即可实现每个一员工的区分,该身份证号码即为候选键,任何一个候选键都可以被选作主键。在找不到候选键时,可额外增加属性以实现区分,如果在员工关系中,没有对其身份证号进行存储,而姓名可能会在数据库运行的某个时间重复,无法区分出实体时,设计辟如ID等不重复的编号以实现区分,被添加的编号或ID选作主键。(该主键的添加是在ER设计时添加,不是建库时随意添加)
第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。简而言之,第二范式就是在第一范式的基础上属性完全依赖于主键。第三范式(3NF)属性在1NF基础上,任何非主属性不依赖于其它非主属性[在2NF基础上消除传递依赖]
第三范式(3NF)是第二范式(2NF)的一个子集,即满足第三范式(3NF)必须满足第二范式(2NF)。简而言之,第三范式(3NF)要求一个关系中不包含已在其它关系已包含的非主关键字信息。例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那么在的员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三范式就是属性不依赖于其它非主属性,也就是在满足2NF的基础上,任何非主属性不得传递依赖于主属性。巴德斯科范式(BCNF)属性在1NF基础上,任何非主属性不能对主键子集依赖[在3NF基础上消除对主码子集的依赖]
巴德斯科范式(BCNF)是第三范式(3NF)的一个子集,即满足巴德斯科范式(BCNF)必须满足第三范式(3NF)。通常情况下,巴德斯科范式被认为没有新的设计规范加入,只是对第二范式与第三范式中设计规范要求更强,因而被认为是修正第三范式,也就是说,它事实上是对第三范式的修正,使数据库冗余度更小。这也是BCNF不被称为第四范式的原因。某些书上,根据范式要求的递增性将其称之为第四范式是不规范,也是更让人不容易理解的地方。而真正的第四范式,则是在设计规范中添加了对多值及依赖的要求。
对于BCNF,在主码的任何一个真子集都不能决定于非主属性。关系中U主码,若U中的任何一个真子集X都不能决定于非主属性Y,则该设计规范属性BCNF。例如:在关系R中,U为主码,A属性是主码中的一个属性,若存在A->Y,Y为非主属性,则该关系不属性BCNF。
一般关系型数据库设计中,达到BCNF就可以了!