標准化的資料庫
A. 資料庫標准化
第一範式:確保每列的原子性.
如果每列(或者每個屬性)都是不可再分的最小數據單元(也稱為最小的原子單元),則滿足第一範式.
例如:顧客表(姓名、編號、地址、……)其中"地址"列還可以細分為國家、省、市、區等。
第二範式:在第一範式的基礎上更進一層,目標是確保表中的每列都和主鍵相關.
如果一個關系滿足第一範式,並且除了主鍵以外的其它列,都依賴於該主鍵,則滿足第二範式.
例如:訂單表(訂單編號、產品編號、定購日期、價格、……),"訂單編號"為主鍵,"產品編號"和主鍵列沒有直接的關系,即"產品編號"列不依賴於主鍵列,應刪除該列。
第三範式:在第二範式的基礎上更進一層,目標是確保每列都和主鍵列直接相關,而不是間接相關.
如果一個關系滿足第二範式,並且除了主鍵以外的其它列都不依賴於主鍵列,則滿足第三範式.
為了理解第三範式,需要根據Armstrong公里之一定義傳遞依賴。假設A、B和C是關系R的三個屬性,如果A-〉B且B-〉C,則從這些函數依賴中,可以得出A-〉C,如上所述,依賴A-〉C是傳遞依賴。
例如:訂單表(訂單編號,定購日期,顧客編號,顧客姓名,……),初看該表沒有問題,滿足第二範式,每列都和主鍵列"訂單編號"相關,再細看你會發現"顧客姓名"和"顧客編號"相關,"顧客編號"和"訂單編號"又相關,最後經過傳遞依賴,"顧客姓名"也和"訂單編號"相關。為了滿足第三範式,應去掉"顧客姓名"列,放入客戶表中。
B. 資料庫中哪些資料庫含有國家標準的數據
國家標准化管理委員會的資料庫以及萬方數據都可以查找標準的相關文獻。以下是你所要找的標准,可以去萬方的「中外標准類資料庫」上下載全文。
標准號: GB/T 16924-1997
中文名稱: 鋼件的淬火與回火
英文名稱: Quenching and tempering of steel parts
發布日期: 1997-07-25
實施日期: 1998-02-01
修訂日期:
被代替標准:
採用程度: EQV JIS B6913:1989
中國標准分類: J36
ICS分類: 25.220
標准類型: CF
標准水平: B
起草單位: 機械工業部北京機電研究所
文本頁數: 0
提出部門代碼: 604
技術委員會: 全國熱處理標准化技術委員會
C. 資料庫的規范化,1\2\3範式怎麼理解
#
資料庫標准化與範式- 開發者在線- www.builder.com.cn
標准化是IT資料庫專業人士都必須遵守的戒律,本文介紹資料庫標准化與範式。 ... VALUES (2, 3) INSERT INTO [SQLTips2005].[Certs].[ProgammerLanguages] ...
www.builder.com.cn/2007/0913/50.shtml - 45k - 網頁快照 - 類似網頁
#
資料庫規范化三個範式應用實例- 開發者在線- www.builder.com.cn
2007年10月22日 ... 本文中解釋了資料庫規范化的重要性,並用不同形式的範式規范化了一個保險 ... 一對多(1:M):一對多關聯意味著給定實體的一個實例可以可以與另一個 ...
www.builder.com.cn/2007/1022/572701.shtml - 41k - 網頁快照 - 類似網頁
#
資料庫設計三大範式應用實例剖析- 開發者在線- www.builder.com.cn
2007年10月22日 ... 資料庫的設計範式是資料庫設計所需要滿足的規范,滿足這些規范的資料庫是簡潔的、結構明晰的。 ... 欄位1, 欄位2. 欄位3. 欄位4. 欄位3.1, 欄位3.2 ...
www.builder.com.cn/2007/1022/572002.shtml
D. 什麼是資料庫中的規范化
規范化理論把關系應滿足的規范要求分為幾級,滿足最低要求的一級叫做第一範式(1NF),在第一範式的基礎上提出了第二範式(2NF),在第二範式的基礎上又提出了第三範式(3NF),以後又提出了BCNF範式,4NF,5NF。範式的等級越高,應滿足的約束集條件也越嚴格。
第一範式(1NF)
在關系模式R中中,如果每個屬性值都是不可再分的原子屬性,則稱R是第一範式的關系[2]。例如:關系R(職工號,姓名,電話號碼)中一個人可能有一個辦公室電話和一個住宅電話號碼,規范成為1NF的方法一般是將電話號碼分為單位電話和住宅電話兩個屬性,即 R(職工號,姓名,辦公電話,住宅電話)。1NF是關系模式的最低要求。
第二範式(2NF)
如果關系模式R是1NF且其中的所有非主屬性都完全函數依賴於關鍵字,則稱關系R 是屬於第二範式的[2]。例:選課關系 SC(SNO,CNO,GRADE,CREDIT)其中SNO為學號, CNO為課程號,GRADEGE 為成績,CREDIT 為學分。 由以上條件,關鍵字為組合關鍵字(SNO,CNO)。在應用中使用以上關系模式有以下問題: (1)數據冗餘,假設同一門課由40個學生選修,學分就重復40次;(2)更新復雜,若調整了某課程的學分,相應元組的CREDIT值都要更新,有可能會出現同一門課學分不同;(3)插入異常,如計劃開新課,由於沒人選修,沒有學號關鍵字,只能等有人選修才能把課程和學分存入;(4).刪除異常,若學生已經結業,從當前資料庫刪除選修記錄,而某些課程新生尚未選修,則此門課程及學分記錄無法保存。以上問題產生的原因是非主屬性CREDIT僅函數依賴於CNO,也就是CREDIT部分依賴組合關鍵字(SNO,CNO)而不是完全依賴。解決方法是將以上關系分解成兩個關系模式 SC(SNO,CNO,GRADE)和C(CNO,CREDIT)。新關系包括兩個關系模式,它們之間通過SC中的外鍵CNO相聯系,需要時再進行自然聯接,恢復原來的關系
第三範式(3NF)
如果關系模式R是2NF且其中的所有非主屬性都不傳遞依賴於碼,則稱關系R是屬於第三範式的[1]。例如關系模式S(SNO,SNAME,DNO,DNAME,LOCATION)中各屬性分別代表學號、姓名、所在系、系名稱、系地址。關鍵字SNO決定各個屬性。由於是單個關鍵字,沒有部分依賴的問題,肯定是2NF。但關系S肯定有大量的冗餘,有關學生所在系的幾個屬性DNO,DNAME,LOCATION將重復存儲,插入、刪除和修改時也將產生類似以上例的情況。原因在於關系中存在傳遞依賴,即SNO -> DNO,DNO -> LOCATION, 因此關鍵字SNO對LOCATION函數決定是通過傳遞依賴SNO -> LOCATION 實現的。也就是說,SNO不直接決定非主屬性LOCATION。解決方法是將該關系模式分解為兩個關系S(SNO,SNAME,DNO)和D(DNO,DNAME,LOCATION),兩個關系通過S中的外鍵DNO聯系。
BC範式(BCNF)
如果關系模式R的所有屬性(包括主屬性和非主屬性)都不傳遞依賴於R的任何候選關鍵字,那麼稱關系R是屬於BCNF的。或者說關系模式R中,如果每個決定因素都包含關鍵字(而不是被關鍵字所包含),則R是BCNF[3]。 通常認為BCNF是修正的第三範式,有時也稱為擴充的第三範式。
E. 我國著名的網路標准資料庫主要有哪些
國家標准化管理委員會的資料庫以及萬方數據都可以查找標準的相關文獻。以下是你所要找的標准,可以去萬方的「中外標准類資料庫」上下載全文。
標准號: GB/T 16924-1997
中文名稱: 鋼件的淬火與回火
英文名稱: Quenching and tempering of steel parts
發布日期: 1997-07-25
實施日期: 1998-02-01
修訂日期:
被代替標准:
採用程度: EQV JIS B6913:1989
中國標准分類: J36
ICS分類: 25.220
標准類型: CF
標准水平: B
起草單位: 機械工業部北京機電研究所
文本頁數: 0
提出部門代碼: 604
技術委員會: 全國熱處理標准化技術委員會
F. 請幫我判斷下面這句話的對錯「SQL式標准化的資料庫語言,可以不加修改運行於各種支持SQL的資料庫」
肯定不可以啊,各種資料庫管理系統都有自己的標准啊。先不說關鍵字,不同資料庫SQL寫法都有不同,再有函數什麼的。
可以那樣的話,就不需要資料庫移植了。
G. ISO國際標准化組織資料庫有()檢索,高級檢索等。
摘要 親,我是網路答疑解惑人禹vQ,您的問題我已經看到了,我正在幫您查詢相關的信息並整理答案,打字可能會需要兩到五分鍾左右的等待時間呢,請您稍等一會兒呢!
H. 資料庫規范化的優缺點
優點是降低冗餘,利於保證數據的一致性和完整性;缺點是過度的規范化,易造成查詢和統計時的效率下降,這主要是由於多表連接所造成的問題。適當的反規范化設計可以提高效率,但最好在那些數據不太發生變化的情況下使用。
I. geo資料庫數據如何標准化
標准化的方法就是Counts值:
對給定的基因組參考區域,計算比對上的read數,又稱為raw count(RC)。
aw count作為原始的read計數矩陣是一個絕對值,而絕對值的特點是基因長度、測序深度不同不可以比較。所以我們要進行標准化把count矩陣轉變為相對值,去除基因長度、測序深度的影響,我們採用分析的。
標准化的三種方法得出的三種值:
RPM (Reads per million mapped reads):RPM方法:10^6標准化了測序深度的影響,但沒有考慮轉錄本的長度的影響。
RPKM/FPKM方法:
103標准化了基因長度的影響,106標准化了測序深度的影響。TCGA的數據分析多採用這種結果。
TPM (Transcript per million):TPM的計算方法也同RPKM/FPKM類似,TPM可以看作是RPKM/FPKM值的百分比。
具體判斷方法:
表達量是否需要重新標准化。
可以通過boxplot函數觀察一下樣本表達豐度值的分布是否整齊進行判斷。
是否需要log2:根據數據值的大小。
如果表達豐度的數值在50以內,通常是經過log2轉化的。如果數字在幾百幾千,則是未經轉化的。