資料庫元數據
1. 什麼是資料庫的元數據
1、元數據是進行數據集成所必需的 數據倉庫最大的特點就是它的集成性。
2、它不僅體現在它所包含的數據上,還體現在實施數據倉庫項目的過程當中。一方面,從各個數據源中抽取的數據要按照一定的模式存入數據倉庫中,這些數據源與數據倉庫中數據的對應關系及轉換規則都要存儲在元數據知識庫中;
3、另一方面,在數據倉庫項目實施過程中,直接建立數據倉庫往往費時、費力,因此在實踐當中,人們可能會按照統一的數據模型,首先建設數據集市,然後在各個數據集市的基礎上再建設數據倉庫。
4、不過,當數據集市數量增多時很容易形成"蜘蛛網"現象,而元數據管理是解決"蜘蛛網"的關鍵。如果在建立數據集市的過程中,注意了元數據管理,在集成到數據倉庫中時就會比較順利;
5、如果在建設數據集市的過程中忽視了元數據管理,那麼最後的集成過程就會很困難,甚至不可能實現。
2. 什麼是元資料庫
元數據的英文名稱是「Metadata",它是「關於數據的數據」在地理空間信息中用於描述地理數據集的內容、質量、表示方式、空間參考、管理方式以及數據集的其他特徵,它是實現地理空間信息共享的核心標准之一。目前,國際上對空間元數據標准內容進行研究的組織主要有三個,分別是歐洲標准化委員會(CEN/TC287)、美國聯邦地理數據委員會(FGDC)和國際標准化組織地理信息/地球信息技術委員會(ISO/TC211)。空間元數據標准內容分兩個層次。第一層是目錄信息,主要用於對數據集信息進行宏觀描述,它適合在數字地球的國家級空間信息交換中心或區域以及全球范圍內管理和查詢空間信息時使用。第二層是詳細信息,用來詳細或全面描述地理空間信息的空間元數據標准內容,是數據集生產者在提供空間數據集時必須要提供的信息。
元數據主要有下列幾個方面的作用:
(1)用來組織和管理空間信息,並挖掘空間信息資源,這正是數字地球的特點和優點所在。通過它可以在廣域網或網際網路上准確地識別、定位和訪問空間信息。
(2)幫助數據使用者查詢所需空間信息。比如,它可以按照不同的地理區間、指定的語言以及具體的時間段來查找空間信息資源。
(3)組織和維護一個機構對數據的投資。
(4)用來建立空間信息的數據目錄和數據交換中心。通過數據目錄和數據交換中心等提供的空間元數據內容,用戶可以共享空間信息、維護數據結果,以及對它們進行優化等。
(5)提供數據轉換方面的信息。使用戶在獲取空間信息的同時便可以得到空間元數據信息。通過空間元數據,人們可以接受並理解空間信息,與自己的空間信息集成在一起,進行不同方面的科學分析和決策。描述空間信息的元數據標准體系內容按照部分、復合元素和數據元素來組織,它們是依次包含關系,前者包含後者,即:後者依次組成前者。具體分為8個基本內容部分和4個引用部分,由12個部分組成,其中標准化內容包括標識信息、數據質量信息、數據集繼承信息、空間數據表示信息、空間參照系信息、實體和屬性信息、發行信息以及空間元數據參考信息等內容,另外還有4個部分是標准化部分中必須引用的信息,它們為引用信息、時間范圍信息、聯系信息及地址信息。元數據標准內容體系是通過元數據網路管理系統來實現的,該系統主要由許可權驗證功能(伺服器端驗證)、輸入和合法性校驗功能(客戶端校驗)、查詢功能(伺服器端查詢)與返回和顯示功能(伺服器端格式化查詢結果並返回,客戶端顯示)等組成。利用空間元數據網路管理系統作為空間交換站的共享軟體可基本上實現空間信息的網路共享。
3. 資料庫元數據的分類
技術元數據是存儲關於數據倉庫系統技術細節的數據,是用於開發和管理數據倉庫使用的數據,它主要包括以下信息:數據倉庫結構的描述,包括倉庫模式、視圖、維、層次結構和導出數據的定義,以及數據集市的位置和內容;業務系統、數據倉庫和數據集市的體系結構和模式;匯總用的演算法,包括度量和維定義演算法,數據粒度、主題領域、聚集、匯總、預定義的查詢與報告;;由操作環境到數據倉庫環境的映射,包括源數據和它們的內容、數據分割、數據提取、清理、轉換規則和數據刷新規則、安全(用戶授權和存取控制)。 業務元數據從業務角度描述了數據倉庫中的數據,它提供了介於使用者和實際系統之間的語義層,使得不懂計算機技術的業務人員也能夠讀懂數據倉庫中的數據。業務元數據主要包括以下信息:使用者的業務術語所表達的數據模型、對象名和屬性名;訪問數據的原則和數據的來源;系統所提供的分析方法以及公式和報表的信息;具體包括以下信息: ;企業概念模型:這是業務元數據所應提供的重要的信息,它表示企業數據模型的高層信息、整個企業的業務概念和相互關系。以這個企業模型為基礎,不懂資料庫技術和sql 語句的業務人員對數據倉庫中的數據也能做到心中有數。 ;多維數據模型:這是企業概念模型的重要組成部分,它告訴業務分析人員在數據集市當中有哪些維、維的類別、數據立方體以及數據集市中的聚合規則。這里的數據立方體表示某主題領域業務事實表和維表的多維組織形式。 ;業務概念模型和物理數據之間的依賴:以上提到的業務元數據只是表示出了數據的業務視圖,這些業務視圖與實際的數據倉庫或資料庫、多維資料庫中的表、欄位、維、層次等之間的對應關系也應該在元數據知識庫中有所體現。
4. 資料庫和元數據的關系是什麼,怎樣來區分它倆
元數據,就是表示數據的數據,只要不是我們存儲到資料庫里的數據,大多都可以理解為元數據。描述資料庫的任何數據—作為資料庫內容的對立面—是元數據。因此,列名、資料庫名、用戶名、版本名以及從SHOW語句得到的結果中的大部分字元串是元數據。資料庫就是存放數據的倉庫。
5. 什麼是元數據
元數據(Metadata),又稱中介數據、中繼數據,為描述數據的數據(data about data)。
元數據作用是:
1、描述數據屬性(property)的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。
2、元數據算是一種電子式目錄,為了達到編制目錄的目的,必須在描述並收藏數據的內容或特色,進而達成協助數據檢索的目的。
元數據的應用舉例:
1、數據結構:數據集的名稱、關系、欄位、約束等;
2、數據部署:數據集的物理位置;
3、數據流:數據集之間的流程依賴關系(非參照依賴),包括數據集到另一個數據集的規則;
4、質量度量:數據集上可以計算的度量;
5、度量邏輯關系:數據集度量之間的邏輯運算關系;
6、ETL過程:過程運行的順序,並行、串列;
7、數據集快照:一個時間點上,數據在所有數據集上的分布情況。
(5)資料庫元數據擴展閱讀:
元數據的優點:
1、自描述:元數據自動提供 COM 中 IDL 的功能,允許將一個文件同時用於定義和實現。運行庫模塊和程序集甚至不需要向操作系統注冊。結果,運行庫使用的說明始終反映編譯文件中的實際代碼,從而提高應用程序的可靠性。
2、設計:元數據提供所有必需的有關已編譯代碼的信息,以供用戶從用不同語言編寫的 PE 文件中繼承類。用戶可以創建用任何託管語言(任何面向公共語言運行庫的語言)編寫的任何類的實例,而不用擔心顯式封送處理或使用自定義的互用代碼。
6. 什麼是元數據(MetaData)及
元數據是對數據資源的描述,英文名稱是「Metadata」,通常被解釋為data about data,即關於數據的數據。元數據是信息共享和交換的基礎和前提,用於描述數據集的內容、質量、表示方式、空間參考、管理方式以及數據集的其他特徵。
隨著信息技術不斷發展,以及人們對信息共享的迫切需求,元數據技術被應用於更多的領域,如:在圖書館與信息界,元數據被定為提供關於信息資源或數據的一種結構化的數據,是對信息資源的結構化的描述;在數據倉庫領域中,元數據被 被定義為描述數據及其環境的數據;在軟體構造領域,元數據被定義為在程序中不是被加工的對象,而是通過其值的改變來改變程序的行為的數據。
7. 資料庫中什麼事元數據
元數據最本質、最抽象的定義為:data about data (關於數據的數據)。具體指在資料庫建設過程中所產生的有關數據源定義,目標定義,轉換規則等相關的關鍵數據。包括以下信息:程序集的說明;標識(名稱、版本、區域性、公鑰);導出的類型;該程序集所依賴的其他程序集;運行所需的安全許可權;類型的說明;名稱、可見性、基類和實現的介面;成員(方法、欄位、屬性、事件、嵌套的類型);屬性;修飾類型和成員的其他說明性元素。
8. 元資料庫是什麼與資料庫有何區別
元數據(Meta Date),主要記錄數據倉庫中模型的定義、各層級間的映射關系、監控數據倉庫的數據狀態及ETL的任務運行狀態。一般會通過元數據資料庫(Metadata Repository)來統一地存儲和管理元數據,其主要目的是使數據倉庫的設計、部署、操作和管理能達成協同和一致。
元數據是數據倉庫管理系統的重要組成部分,元數據管理是企業級數據倉庫中的關鍵組件,貫穿數據倉庫構建的整個過程,直接影響著數據倉庫的構建、使用和維護。
- 構建數據倉庫的主要步驟之一是ETL。這時元數據將發揮重要的作用,它定義了源數據系統到數據倉庫的映射、數據轉換的規則、數據倉庫的邏輯結構、數據更新的規則、數據導入歷史記錄以及裝載周期等相關內容。數據抽取和轉換的專家以及數據倉庫管理員正是通過元數據高效地構建數據倉庫。
- 用戶在使用數據倉庫時,通過元數據訪問數據,明確數據項的含義以及定製報表。
- 數據倉庫的規模及其復雜性離不開正確的元數據管理,包括增加或移除外部數據源,改變數據清洗方法,控制出錯的查詢以及安排備份等。
元數據可分為技術元數據和業務元數據。技術元數據為開發和管理數據倉庫的IT 人員使用,它描述了與數據倉庫開發、管理和維護相關的數據,包括數據源信息、數據轉換描述、數據倉庫模型、數據清洗與更新規則、數據映射和訪問許可權等。而業務元數據為管理層和業務分析人員服務,從業務角度描述數據,包括商務術語、數據倉庫中有什麼數據、數據的位置和數據的可用性等,幫助業務人員更好地理解數據倉庫中哪些數據是可用的以及如何使用。
由上可見,元數據不僅定義了數據倉庫中數據的模式、來源、抽取和轉換規則等,而且是整個數據倉庫系統運行的基礎,元數據把數據倉庫系統中各個鬆散的組件聯系起來,組成了一個有機的整體。
派可數據,用心創造數據價值 讓數據分析更簡單
9. 什麼是mysql中的元數據
所謂元數據,就是表示數據的數據,這些數據五花八門,總之,只要不是我們存儲到資料庫里的數據,大多都可以理解為元數據。描述資料庫的任何數據—作為資料庫內容的對立面—是元數據。因此,列名、資料庫名、用戶名、版本名以及從SHOW語句得到的結果中的大部分字元串是元數據。還包括INFORMATION_SCHEMA資料庫中的表中的內容,因為定義的那些表存儲關於資料庫對象的信息。
10. 資料庫的元數據是什麼數據在網上搜了一下,說是數據的數據,但還是理解不了,誰具體解釋下
元數據概念范圍很廣,表中的欄位當然也算是元數據。
簡要來說,元數據是指描述基本數據結構的對象,也就是說「數據的數據」。這個描述可大可小,小如欄位,大如文檔,如各種文檔(如圖片、excel文檔)等,也可認為是元數據。
基於應用,元數據可分成以下的若干種(某些分類例子)。
數據結構:數據集的名稱、關系、欄位、約束等;
數據部署:數據集的物理位置;
數據流:數據集之間的流程依賴關系(非參照依賴),包括數據集到另一個數據集的規則;
質量度量:數據集上可以計算的度量;
度量邏輯關系:數據集度量之間的邏輯運算關系;
ETL過程:過程運行的順序,並行、串列;
數據集快照:一個時間點上,數據在所有數據集上的分布情況;
星型模式元數據:事實表、維度、屬性、層次等;
報表語義層:報表指標的規則、過濾條件物理名稱和業務名稱的對應;
數據訪問日誌:哪些數據何時被何人訪問;
質量稽核日誌:何時、何度量被稽核,其結果;
數據裝載日誌:哪些數據何時被何人裝載;