标准化的数据库
A. 数据库标准化
第一范式:确保每列的原子性.
如果每列(或者每个属性)都是不可再分的最小数据单元(也称为最小的原子单元),则满足第一范式.
例如:顾客表(姓名、编号、地址、……)其中"地址"列还可以细分为国家、省、市、区等。
第二范式:在第一范式的基础上更进一层,目标是确保表中的每列都和主键相关.
如果一个关系满足第一范式,并且除了主键以外的其它列,都依赖于该主键,则满足第二范式.
例如:订单表(订单编号、产品编号、定购日期、价格、……),"订单编号"为主键,"产品编号"和主键列没有直接的关系,即"产品编号"列不依赖于主键列,应删除该列。
第三范式:在第二范式的基础上更进一层,目标是确保每列都和主键列直接相关,而不是间接相关.
如果一个关系满足第二范式,并且除了主键以外的其它列都不依赖于主键列,则满足第三范式.
为了理解第三范式,需要根据Armstrong公里之一定义传递依赖。假设A、B和C是关系R的三个属性,如果A-〉B且B-〉C,则从这些函数依赖中,可以得出A-〉C,如上所述,依赖A-〉C是传递依赖。
例如:订单表(订单编号,定购日期,顾客编号,顾客姓名,……),初看该表没有问题,满足第二范式,每列都和主键列"订单编号"相关,再细看你会发现"顾客姓名"和"顾客编号"相关,"顾客编号"和"订单编号"又相关,最后经过传递依赖,"顾客姓名"也和"订单编号"相关。为了满足第三范式,应去掉"顾客姓名"列,放入客户表中。
B. 数据库中哪些数据库含有国家标准的数据
国家标准化管理委员会的数据库以及万方数据都可以查找标准的相关文献。以下是你所要找的标准,可以去万方的“中外标准类数据库”上下载全文。
标准号: GB/T 16924-1997
中文名称: 钢件的淬火与回火
英文名称: Quenching and tempering of steel parts
发布日期: 1997-07-25
实施日期: 1998-02-01
修订日期:
被代替标准:
采用程度: EQV JIS B6913:1989
中国标准分类: J36
ICS分类: 25.220
标准类型: CF
标准水平: B
起草单位: 机械工业部北京机电研究所
文本页数: 0
提出部门代码: 604
技术委员会: 全国热处理标准化技术委员会
C. 数据库的规范化,1\2\3范式怎么理解
#
数据库标准化与范式- 开发者在线- www.builder.com.cn
标准化是IT数据库专业人士都必须遵守的戒律,本文介绍数据库标准化与范式。 ... VALUES (2, 3) INSERT INTO [SQLTips2005].[Certs].[ProgammerLanguages] ...
www.builder.com.cn/2007/0913/50.shtml - 45k - 网页快照 - 类似网页
#
数据库规范化三个范式应用实例- 开发者在线- www.builder.com.cn
2007年10月22日 ... 本文中解释了数据库规范化的重要性,并用不同形式的范式规范化了一个保险 ... 一对多(1:M):一对多关联意味着给定实体的一个实例可以可以与另一个 ...
www.builder.com.cn/2007/1022/572701.shtml - 41k - 网页快照 - 类似网页
#
数据库设计三大范式应用实例剖析- 开发者在线- www.builder.com.cn
2007年10月22日 ... 数据库的设计范式是数据库设计所需要满足的规范,满足这些规范的数据库是简洁的、结构明晰的。 ... 字段1, 字段2. 字段3. 字段4. 字段3.1, 字段3.2 ...
www.builder.com.cn/2007/1022/572002.shtml
D. 什么是数据库中的规范化
规范化理论把关系应满足的规范要求分为几级,满足最低要求的一级叫做第一范式(1NF),在第一范式的基础上提出了第二范式(2NF),在第二范式的基础上又提出了第三范式(3NF),以后又提出了BCNF范式,4NF,5NF。范式的等级越高,应满足的约束集条件也越严格。
第一范式(1NF)
在关系模式R中中,如果每个属性值都是不可再分的原子属性,则称R是第一范式的关系[2]。例如:关系R(职工号,姓名,电话号码)中一个人可能有一个办公室电话和一个住宅电话号码,规范成为1NF的方法一般是将电话号码分为单位电话和住宅电话两个属性,即 R(职工号,姓名,办公电话,住宅电话)。1NF是关系模式的最低要求。
第二范式(2NF)
如果关系模式R是1NF且其中的所有非主属性都完全函数依赖于关键字,则称关系R 是属于第二范式的[2]。例:选课关系 SC(SNO,CNO,GRADE,CREDIT)其中SNO为学号, CNO为课程号,GRADEGE 为成绩,CREDIT 为学分。 由以上条件,关键字为组合关键字(SNO,CNO)。在应用中使用以上关系模式有以下问题: (1)数据冗余,假设同一门课由40个学生选修,学分就重复40次;(2)更新复杂,若调整了某课程的学分,相应元组的CREDIT值都要更新,有可能会出现同一门课学分不同;(3)插入异常,如计划开新课,由于没人选修,没有学号关键字,只能等有人选修才能把课程和学分存入;(4).删除异常,若学生已经结业,从当前数据库删除选修记录,而某些课程新生尚未选修,则此门课程及学分记录无法保存。以上问题产生的原因是非主属性CREDIT仅函数依赖于CNO,也就是CREDIT部分依赖组合关键字(SNO,CNO)而不是完全依赖。解决方法是将以上关系分解成两个关系模式 SC(SNO,CNO,GRADE)和C(CNO,CREDIT)。新关系包括两个关系模式,它们之间通过SC中的外键CNO相联系,需要时再进行自然联接,恢复原来的关系
第三范式(3NF)
如果关系模式R是2NF且其中的所有非主属性都不传递依赖于码,则称关系R是属于第三范式的[1]。例如关系模式S(SNO,SNAME,DNO,DNAME,LOCATION)中各属性分别代表学号、姓名、所在系、系名称、系地址。关键字SNO决定各个属性。由于是单个关键字,没有部分依赖的问题,肯定是2NF。但关系S肯定有大量的冗余,有关学生所在系的几个属性DNO,DNAME,LOCATION将重复存储,插入、删除和修改时也将产生类似以上例的情况。原因在于关系中存在传递依赖,即SNO -> DNO,DNO -> LOCATION, 因此关键字SNO对LOCATION函数决定是通过传递依赖SNO -> LOCATION 实现的。也就是说,SNO不直接决定非主属性LOCATION。解决方法是将该关系模式分解为两个关系S(SNO,SNAME,DNO)和D(DNO,DNAME,LOCATION),两个关系通过S中的外键DNO联系。
BC范式(BCNF)
如果关系模式R的所有属性(包括主属性和非主属性)都不传递依赖于R的任何候选关键字,那么称关系R是属于BCNF的。或者说关系模式R中,如果每个决定因素都包含关键字(而不是被关键字所包含),则R是BCNF[3]。 通常认为BCNF是修正的第三范式,有时也称为扩充的第三范式。
E. 我国着名的网络标准数据库主要有哪些
国家标准化管理委员会的数据库以及万方数据都可以查找标准的相关文献。以下是你所要找的标准,可以去万方的“中外标准类数据库”上下载全文。
标准号: GB/T 16924-1997
中文名称: 钢件的淬火与回火
英文名称: Quenching and tempering of steel parts
发布日期: 1997-07-25
实施日期: 1998-02-01
修订日期:
被代替标准:
采用程度: EQV JIS B6913:1989
中国标准分类: J36
ICS分类: 25.220
标准类型: CF
标准水平: B
起草单位: 机械工业部北京机电研究所
文本页数: 0
提出部门代码: 604
技术委员会: 全国热处理标准化技术委员会
F. 请帮我判断下面这句话的对错“SQL式标准化的数据库语言,可以不加修改运行于各种支持SQL的数据库”
肯定不可以啊,各种数据库管理系统都有自己的标准啊。先不说关键字,不同数据库SQL写法都有不同,再有函数什么的。
可以那样的话,就不需要数据库移植了。
G. ISO国际标准化组织数据库有()检索,高级检索等。
摘要 亲,我是网络答疑解惑人禹vQ,您的问题我已经看到了,我正在帮您查询相关的信息并整理答案,打字可能会需要两到五分钟左右的等待时间呢,请您稍等一会儿呢!
H. 数据库规范化的优缺点
优点是降低冗余,利于保证数据的一致性和完整性;缺点是过度的规范化,易造成查询和统计时的效率下降,这主要是由于多表连接所造成的问题。适当的反规范化设计可以提高效率,但最好在那些数据不太发生变化的情况下使用。
I. geo数据库数据如何标准化
标准化的方法就是Counts值:
对给定的基因组参考区域,计算比对上的read数,又称为raw count(RC)。
aw count作为原始的read计数矩阵是一个绝对值,而绝对值的特点是基因长度、测序深度不同不可以比较。所以我们要进行标准化把count矩阵转变为相对值,去除基因长度、测序深度的影响,我们采用分析的。
标准化的三种方法得出的三种值:
RPM (Reads per million mapped reads):RPM方法:10^6标准化了测序深度的影响,但没有考虑转录本的长度的影响。
RPKM/FPKM方法:
103标准化了基因长度的影响,106标准化了测序深度的影响。TCGA的数据分析多采用这种结果。
TPM (Transcript per million):TPM的计算方法也同RPKM/FPKM类似,TPM可以看作是RPKM/FPKM值的百分比。
具体判断方法:
表达量是否需要重新标准化。
可以通过boxplot函数观察一下样本表达丰度值的分布是否整齐进行判断。
是否需要log2:根据数据值的大小。
如果表达丰度的数值在50以内,通常是经过log2转化的。如果数字在几百几千,则是未经转化的。