xml做資料庫
① xml資料庫的簡介
目前XML資料庫有三種類型:
(1)XMLEnabledDatabase(XEDB),即能處理XML的資料庫。其特點是在原有的資料庫系統上擴充對XML數據的處理功能,使之能適應XML數據存儲和查詢的需要。一般的做法是在資料庫系統之上增加XML映射層,這可以由資料庫供應商提供,也可以由第三方廠商提供。映射層管理XML數據的存儲和檢索,但原始的XML元數據和結構可能會丟失,而且數據檢索的結果不能保證是原始的XML形式。XEDB的基本存儲單位與具體的實現緊密相關。
(2)NativeXMLDatabase(NXD),即純XML資料庫。其特點是以自然的方式處理XML數據,以XML文檔作為基本的邏輯存儲單位,針對XML的數據存儲和查詢特點專門設計適用的數據模型和處理方法。
(3)HybridXMLDatabase(HXD),即混合XML資料庫。根據應用的需求,可以視其為XEDB或NXD的資料庫,典型的例子是Ozone。
XML資料庫是一個能夠在應用中管理XML數據和文檔的集合的資料庫系統。XML資料庫是XML文檔及其部件的集合,並通過一個具有能力管理和控制這個文檔集合本身及其所表示信息的系統來維護。XML資料庫不僅是結構化數據和半結構化數據的存儲庫,像管理其它數據一樣,持久的XML數據管理包括數據的獨立性、集成性、訪問許可權、視圖、完備性、冗餘性、一致性以及數據恢復等。這些文檔是持久的並且是可以操作的。
當前著重於頁面顯示格式的HTML標記語言和基於它的關鍵詞檢索等技術已經不能滿足用戶日益增長的信息需求。近年來的研究致力於將資料庫技術應用於網上數據的管理和查詢,使查詢可以在更細的粒度上進行,並集成多個數據源的數據。但困難在於網上數據缺乏統一的、固定的模式,數據往往是不規則且經常變動的。因此,XML數據作為一種自描述的半結構化數據為Web的數據管理提供了新的數據模型,如果將XML標記數據放入一定的結構中,對數據的檢索、分析、更新和輸出就能夠在更加容易管理的、系統的和較為熟悉的環境下進行,因而我們將資料庫技術應用於XML數據處理領域,通過XML數據模型與資料庫模型的映射來存儲、提取、綜合和分析XML文檔的內容。這為資料庫研究開拓了一個新的方向,將資料庫技術的研究擴展到對Web數據的管理。
② 做一個網站,把數據保存在xml文件中,跟把數據保存在資料庫中,區別有多大
實話實說,個人接觸到使用Xml文件方式來保存數據的場景少之又少。除去求學期間根據課堂要求做靜態網站時用於存儲一些展示性數據,還有就是在WPF開發中保存一些常用但又不經常變化的離線數據。反而常使用Xml來做配置文件(例如SpringMvc、MyBatis和LogBack)網路數據傳輸和交互標准(例如WebService)、工作流設計(例如Activiti6)等情況較為常見。
Xml用於單設備數據存儲的情況還說得過去,例如離線數據同步可以放在Xml數據文件中。在傳統行業電商平台的規格,材質,產區等屬性相對固定,Xml文件能很好勝任。再比如做一個內部使用的抽獎程序,將潛在用戶群體以Xml方式保存也是不錯的選擇吧。所以Xml文件充當小型離線資料庫還行。
而資料庫的范圍就比較寬泛,大致可以分為關系型資料庫和非關系型資料庫兩大類。
關系型資料庫以Oracle和MySql最為流困念渣行,學過編程的朋友應該耳熟能詳,也是職場面試經久不衰的考察重點。
而NoSql算是後起之秀。在業務繁多復雜的當下,一些場景下關系型資料庫應付起來相當吃力,有著更為復雜分類的非關系型資料庫孕育而生。NoSql在搜索引擎(ElasticSearch)、鍵值(redis)、面向文檔(Mongodb)和列存儲(Hbase)等方面都能做高拆到得心應手。這些就讓其有著更強的業務針對性,相比傳統關系型資料庫有著質的提升。下面簡單列舉幾個應用場景。
Redis可用於計數、分布式鎖實現、單點登錄、限流和緩存數據等;
在復雜頁面的數據不便以表數據結構保存時,使用Mongodb整頁存儲方便又簡單;
Elasticsearch就是以空間換時間典型代表,在做搜索引擎和日誌記錄(ELK)等方面有很大優勢;
Hbase不必再像關系型資料庫那樣以行為存儲單元,而是以列為基準,非常便於數據結構拓展。
當下流行徽服務和各種解耦,連關系型資料庫都不再設計外鍵關系,非關系型資料庫大行其道,Xml文件用來汪悄保存數據顯然已經不合時宜,當然也不能否認關系型資料庫的地位和Xml的作用。重要數據或某些行業的特殊性還是要以關系型資料庫為根基,畢竟事務、穩定性、安全性和技術恢復支持等方面需要考慮的重點。
③ 什麼是xml資料庫
開始討論XML和資料庫之前,我們先回答許多人都遇到過的問題:「XML是資料庫嗎?」
如果僅按資料庫這個術語的本質來看,XML文件就是資料庫,它是數據的集合。在許多方面看起來它和其他文件沒什麼區別 -- 無論如何,每個文件都含有某種類型的數據。作為一種「資料庫」格式,XML有一些優勢:例如,它是自描述的(所用的標記描述了數據的結構和類型,盡管缺乏語義),可交換的(portable)(Unicode),能夠以樹型或圖形結構描述數據。同樣它也有缺點,例如,它顯得有些繁瑣,由於要對它進行解析和文本轉換,所以數據訪問速度較慢。
一個更有用的問題就是在較為寬松的意義上,XML及其周邊技術是否可以算作「資料庫」 -- 資料庫管理系統(DBMS)。答案是「在某種程度上是(sort of)」。從正面來說,XML提供了許多資料庫所具備的東西:存儲(XML文檔), 模式(DTD, XML schema,RElAX NG 等等), 查詢語言(XQuery, XPath, XQL, XML-QL, QUILT等等),編程介面(SAX, DOM,JDOM)等等。從反面來說,它缺少一些作為實用的資料庫所應具備的特性:高效的存儲,索引,安全,事務和數據一致性,多用戶訪問,觸發器,在查詢多個文件等等。
因此,盡管在數據量小、用戶少和性能要求不太高的環境下,可以將XML文檔用作資料庫,但是卻不適用於用戶量大、數據集成度高以及性能要求高的作業環境。
XML適合於用作所謂「資料庫」的一個好例子就是 .ini文件 -- 它包含應用程序的配置信息。與其寫一個處理以逗號分隔(comma-delimited)的文件的解析器,開發一種小型的XML語言並寫一個解釋它的 SAX程序要容易的多。此外,XML允許使用嵌套的實體,而逗號分隔的文件(comma-delimited files)很難做到這點。然而,說它就是資料庫還很勉強,因為它是線性讀寫的,而且僅用在程序開始和結束時。
比較適合於XML資料庫的一些復雜的數據集就是個人通訊錄(名字,電話號碼,地址等),或用於描述瀏覽器書簽以及用Napster偷來的MP3。然而,由於dBase和Access之類的資料庫物美價廉,即使在這種情況下似乎也沒有多少理由把XML文件作為資料庫使用。XML的唯一真正好處就是數據的可交換性(portable),由於有越來越多的工具可以用來對資料庫進行XML序列化(serializing),這一點好處似乎也要打些折扣。