資料庫有關
㈠ 有關資料庫的小故事
故事一、啤酒與尿布
世界零售連鎖企業巨頭沃爾瑪擁有世界上最大的數據倉庫系統之一,裡面存放了各個門店的詳細交易信息。為了能夠准確了解顧客的購買習慣,沃爾瑪利對顧客的購物行為進行了購物籃分析,想知道顧客經常一起購買的商品有哪些,結果他們有了意外的發現:「跟尿布一起購買最多的商品竟是啤酒!」
這是數據挖掘技術對歷史數據進行分析的結果,它符合現實情況嗎?是否是一個有用的知識?是否有利用價值?
於是,沃爾瑪派出市場調查人員和分析師對這一挖掘結果進行調查分析。經過大量實際調查和分析,揭示了一個隱藏在「尿布與啤酒」背後的美國人的一種行為模式:一些年輕的父親下班後經常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。產生這一現象的原因是:美國的太太們常叮囑她們的丈夫下班後為小孩買尿布,而丈夫們在買尿布後又隨手帶回了他們喜歡的啤酒。
既然尿布與啤酒一起被購買的機會很多,於是沃爾瑪就將尿布與啤酒並排擺放在一起,結果是尿布與啤酒的銷售量雙雙增長。
按常規思維,尿布與啤酒風馬牛不相及,若不是藉助數據挖掘技術對大量交易數據進行挖掘分析,沃爾瑪是不可能發現數據內在這一有價值的規律的。
故事二、犯罪的根源
格洛斯特郡是英格蘭西部的一個郡,大約有五十多萬人口。在有一段時間內,發生了多起搶劫案,民眾不再感覺到安全,對郡警察局的輿論壓力也陡然增加了,強烈要求及時破獲這些案件,並避免案件的進一步發生。警方一方面在加快破案的同時,也在努力思考怎麼樣才可以降低發案率。
按照傳統的做法,一般會採取這樣的措施:鎖定搶劫案的多發地區,加派警力進行巡邏,對行為異常的人員加強盤查等等。然而,格洛斯特郡警察局發現,這些措施的收效甚微,發案率依然居高不下,因為搶劫案的發案地點並不集中,分散在多個不同的街區,這讓巡邏警力的安排顯得捉襟見肘,難以全面顧及。
此時,來自警察局內部的分析系統卻有了新的發現。系統中保存了多年的案件和案犯的卷宗信息,通過利用數據挖掘等分析技術,揭示出最近這段時間的搶劫犯具有一些非常顯著的特徵:他們大多是沒有固定住所,無家可歸,而且也沒有穩定的工作。另外,在很多搶劫案發生前,這些罪犯都吸食了毒品。正是在毒品的刺激作用下,他們失去了自控能力,臨時見財起意,對單身女性或情侶實施搶劫。
新的發現給警察局帶來了新的思路,警方當機立斷,對原來的增加警力加強巡邏的做法進行了調整,改為採取如下措施:一是加強對無業人員和有吸毒前科人員的管理,並通過社會福利機構對他們實施救助;然後,加強了對毒品交易易發場所的嚴打和治理,從源頭上掐斷毒品的供應。
治理得到了良好的效果,搶劫案的發案率迅速降低,格洛斯特郡的人們又重新恢復了平靜的生活。
故事三、電郵加新聞
Yahoo是第一家招募了首席數據官的公司,以驗證對公司而言,數據的確是一筆真實而有戰略意義的財富。目標是通過提供以客戶為中心的數據平台和洞察力服務,激勵用戶積極參與,對營銷方案進行創新,從而為消費者和賣家帶來價值。Usama Fayyad博士是Yahoo的首席數據官,他在和KDnuggets的Gregory的訪談中介紹了一些Yahoo在數據挖掘方面的成功案例。
「產品整合:一個例子就是你今天在Yahoo電子郵箱上看到的,數據挖掘的可視結果。通過對用戶使用行為的意外模式分析,我們發現在每次會話中,人們閱讀郵件和閱讀新聞的行為之間存在很強的相關關系。我們把這個發現傳達給Yahoo電子郵箱產品小組,他們首先想到的就是驗證這種關系的影響:在一組測試用戶的郵箱首頁上顯示一個新聞模塊,其中的新聞標題被醒目顯示。」
「對於象電子郵箱這種產品,最頭痛的問題就是如何獲取新的『輕量級用戶』,並推動他們的用量,使之變成『重量級用戶』。如果你做到了,那麼流失率就會顯著下降。實際上,在我們的試驗中,最顯著的一組流失率下降了40%。於是Yahoo立刻開發並完善了新聞模塊,並嵌入Yahoo電子郵箱的首頁,到現在,上億的消費者都可以看到並使用這種產品。我喜歡提及這個故事,因為它很好地說明了我們產品團隊的及時反應能力,也證明了在用戶使用行為數據中蘊含著很多很多極具價值的潛在模式。」
「即時通信:我們對雅虎通(Instant Messenger)的使用情況進行了分析,以了解激勵用量的關鍵因素是什麼。結果發現,最重要的因素是讓用戶擴大他們的『好友列表』,至少增加5個新的好友。據此Yahoo精心設計了相應的營銷活動,鼓勵用戶增加好友列表中的好友數,從而顯著激勵了雅虎通的用量。」
「Yahoo首頁的搜索框:一個簡單的例子就是我們發現,在Yahoo的首頁上,把搜索框放在居中的位置(而不是以前的左側)將提高用戶的用量。這樣一方面可以促進用戶的積極使用,對Yahoo來說也沒有成本支出。這個結果的發現過程也很有趣,我們首先發現Netscape瀏覽器的用戶比IE的用戶更多地使用了搜索功能,進一步探查發現兩個瀏覽器在視覺上的唯一區別就是:二者中的搜索框位置不同!搜索框在Netscape瀏覽器中是居中放置,而在IE中則是靠近左側。很不明顯的差別,但卻很重要。一般誰會想到呢?」
㈡ 資料庫系統的組成,及各自的作用
1、資料庫(database,DB)
作用是資料庫中的數據按一定的數學模型組織、描述和存儲,有組織,可共享的數據的集合。具有較小的冗餘,較高的數據獨立性和易擴展性,並可為各種用戶共享。
2、硬體
構成計算機系統的各種物理設備,包括存儲所需的外部設備。作用是硬體的配置應滿足整個資料庫系統的需要。
3、軟體
包括操作系統、資料庫管理系統及應用程序。資料庫管理系統是資料庫系統的核心軟體,作用是在操作系統的支持下工作,科學地組織和存儲數據,高效獲取和維護數據的系統軟體。其主要功能包括數據定義功能、數據操縱功能、資料庫的運行管理和資料庫的建立與維護。
4、人員
主要分類及其作用是系統分析員和資料庫設計人員,負責應用系統的需求分析和規范說明,確定系統的硬體配置,並參與資料庫系統的概要設計;應用程序員,負責編寫使用資料庫的應用程序,利用系統的介面或查詢語言訪問資料庫;資料庫管理員負責資料庫的總體信息控制。
(2)資料庫有關擴展閱讀:
資料庫系統的模型
1、層次模型:用一顆「有向樹」的數據結構來表示各類實體以及實體間的聯系,樹中每一個節點代表一個記錄類型,樹狀結構表示實體型之間的聯系。層次數據模型的提出,首先是為了模擬這種按層次組織起來的事物。層次資料庫也是按記錄來存取數據的。
2、網狀模型:取消了層次模型的不能表示非數狀結構的限制,兩個或兩個以上的結點都可以有多個雙親結點,則此時有向樹變成了有向圖,該有向圖描述了網狀模型。網狀模型中以記錄為數據的存儲單位。記錄包含若干數據項。
3、關系模型:基本假定是所有數據都表示為數學上的關系。關系數據模型以集合論中的關系概念為基礎發展起來的。關系模型中無論是實體還是實體間的聯系均由單一的結構類型關系來表示。
㈢ 資料庫基礎 有關
第一章 資料庫基礎知識
本章以概念為主,主要是了解資料庫的基本概念,資料庫技術的發展,數據模型,重點是關系型數據。
第一節:信息,數據與數據處理
一、 信息與數據:
1、 信息:是現實世界事物的存在方式或運動狀態的反映。或認為,信息是一種已經被加工為特定形式的數據。
信息的主要特徵是:信息的傳遞需要物質載體,信息的獲取和傳遞要消費能量;信息可以感知;信息可以存儲、壓縮、加工、傳遞、共享、擴散、再生和增值
2、 數據:數據是信息的載體和具體表現形式,信息不隨著數據形式的變化而變化。數據有文字、數字、圖形、聲音等表現形式。
3、 數據與信息的關系:一般情況下將數據與信息作為一個概念而不加區分。
二、 數據處理與數據管理技術:
1、 數據處理:數據處理是對各種形式的數據進行收集、存儲、加工和傳輸等活動的總稱。
2、 數據管理:數據收集、分類、組織、編碼、存儲、檢索、傳輸和維護等環節是數據處理的基本操作,稱為數據管理。數據管理是數據處理的核心問題。
3、 資料庫技術所研究的問題不是如何科學的進行數據管理。
4、 數據管理技術的三個階段:人工管理,文件管理和資料庫系統。
第二節:資料庫技術的發展
一、 資料庫的發展:資料庫的發展經歷了三個階段:
1、 層次型和網狀型:
代表產品是1969年IBM公司研製的層次模型資料庫管理系統IMS。
2、 關系型數據型庫:
目前大部分資料庫採用的是關系型資料庫。1970年IBM公司的研究員E.F.Codd提出了關系模型。其代表產品為sysem R和Inges。
3、 第三代資料庫將為更加豐富的數據模型和更強大的數據管理功能為特徵,以提供傳統資料庫系統難以支持的新應用。它必須支持面向對象,具有開放性,能夠在多個平台上使用。
二、 資料庫技術的發展趨勢:
1、 面向對象的方法和技術對資料庫發展的影響:
資料庫研究人員借鑒和吸收了面向對旬的方法和技術,提出了面向對象數據模型。
2、 資料庫技術與多學科技術的有機組合:
3、 面向專門應用領域的資料庫技術
三、 資料庫系統的組成:
資料庫系統(DBS)是一個採用資料庫技術,具有管理資料庫功能,由硬體、軟體、資料庫及各類人員組成的計算機系統。
1、 資料庫(DB):
資料庫是以一定的組織方式存放於計算機外存儲器中相互關聯的數據集合,它是資料庫系統的核心和管理對象,其數據是集成的、共享的以及冗餘最小的。
2、 資料庫管理系統(DBMS):
資料庫管理系統是維護和管理資料庫的軟體,是資料庫與用戶之間的界面。作為資料庫的核心軟體,提供建立、操作、維護資料庫的命令和方法。
3、 應用程序:
對資料庫中數據進行各種處理的程序,由用戶編寫。
4、 計算機軟體:
5、 計算機硬體:
包括CPU、內存、磁碟等。要求有足夠大的內存來存放操作系統、資料庫管理系統的核心模塊以及資料庫緩沖;足夠大的磁碟能夠直接存取和備份數據;比較主的通道能力;支持聯網,實現數據共享。
6、 各類人員。
四、 資料庫系統的特點:
1、 數據共享:
2、 面向全組織的數據結構化:
數據不再從屬於一個特定應用,而是按照某種模型組織成為一個結構化的整。它描述數據要身的特性,也描述數據與數據之間的種種聯系。
3、 數據獨立性:
4、 可控數據冗餘度:
5、 統一數據控制功能:
數據安全性控制:指採取一定的安全保密措施確保資料庫中的數據不被非法用戶存取而造成數據的泄密和破壞;
數據完整性控制:是指數據的正確性、有效性與相容性。
並發控制:多個用戶對數據進行存取時,採取必要的措施進行數據保護;
數據恢復:系統能進行應急處理,把數據恢復到正確狀態。
Record):又稱為結點,由若干個數據項組成,用於描述一個對象;
3、 文件(File):由若干個記錄組成;
4、 資料庫(Data Base):由邏輯相關的文件組成。
二、 數據模型:
數據的組織形式稱為數據模型,它決定 數據(主要是結點)之間聯系的表達方式。主要包括層次型、網狀型、關系型和面向對象型四種。層次型和網狀型是早期的數據模型,又稱為格式化數據系統數模型。
以上四種模型決定了四種類型的資料庫:層次資料庫系統,網狀資料庫系統,關系型資料庫系統以及面向對象資料庫系統。
目前微機上使用的主要是關系型資料庫。
1、 層次型:是以記錄為結點的有向樹;圖如教材P7圖1--2
2、 網狀型:樹的集合,它的表示能力以及精巧懷強於層次型,但獨立性下降。
3、 關系型:
在關系型中,數據被組織成若干張二維表,每張表稱為一個關系。
一張表格中的一列稱為一個「屬性」,相當於記錄中的一個數據項(或稱為欄位),屬性的取值范圍稱為域。
表格中的一行稱為一個「元組」,相當於記錄值。
可用一個或若干個屬性集合的值標識這些元組,稱為「關鍵字」。
每一行對應的屬性值叫做一個分量。
表格的框架相當於記錄型,一個表格數據相當於一個同質文件。所有關系由關系的框架和若干元組構成,或者說關系是一張二維表。
關系型的特點:描述的一致性;可直接表示多對多關系;關系必須是規范化的;關系模型建立在數學概念基礎上。
4、 面向對象型:主要採用對象和燈的概念。
第四節:關系型資料庫
一、 關系型資料庫的發展:
1、 資料庫產品種類繁多:像dBASE,FoxBASE,Clipper,Paradox,Acess等。
2、 採用sql語言:SQL(Structured Query Language)「結構化查詢語言」,是通用的關系型資料庫操作語言,可以查詢、定義、操縱和控制資料庫。它是一種非過程化語言。
3、 支持面向對象的程序設計:
4、 提供良好的圖形界面和窗口;
5、 支持開放的客戶機/伺服器和分布式處理;
6、 提供新一代的資料庫管理系統開發工具:支持GUI(圖形界面)、ODBC(開放資料庫連接)、OLE(對象的鏈接與嵌入)、DLL(動態鏈接)等。
二、 關系型資料庫管理系統(RDBMS)及其產品:
主要著名的關系型資料庫產品有Oracle、Sybase、Informix、DB2、Inges、Paradox、Access、SQL Server等。資料庫應用系統開發工具是PowerBuilder和Delphi。
㈣ 資料庫有哪幾種
一、關系資料庫
關系型資料庫,存儲的格式可以直觀地反映實體間的關系。關系型資料庫和常見的表格比較相似,關系型資料庫中表與表之間是有很多復雜的關聯關系的。
常見的關系型資料庫有Mysql,SqlServer等。在輕量或者小型的應用中,使用不同的關系型資料庫對系統的性能影響不大,但是在構建大型應用時,則需要根據應用的業務需求和性能需求,選擇合適的關系型資料庫。
雖然關系型資料庫有很多,但是大多數都遵循SQL(結構化查詢語言,Structured Query Language)標准。 常見的操作有查詢,新增,更新,刪除,求和,排序等。
查詢語句:SELECT param FROM table WHERE condition 該語句可以理解為從 table 中查詢出滿足 condition 條件的欄位 param。
新增語句:INSERT INTO table (param1,param2,param3) VALUES (value1,value2,value3) 該語句可以理解為向table中的param1,param2,param3欄位中分別插入value1,value2,value3。
更新語句:UPDATE table SET param=new_value WHERE condition 該語句可以理解為將滿足condition條件的欄位param更新為 new_value 值。
刪除語句:DELETE FROM table WHERE condition 該語句可以理解為將滿足condition條件的數據全部刪除。
去重查詢:SELECT DISTINCT param FROM table WHERE condition 該語句可以理解為從表table中查詢出滿足條件condition的欄位param,但是param中重復的值只能出現一次。
排序查詢:SELECT param FROM table WHERE condition ORDER BY param1該語句可以理解為從表table 中查詢出滿足condition條件的param,並且要按照param1升序的順序進行排序。
總體來說, 資料庫的SELECT,INSERT,UPDATE,DELETE對應了我們常用的增刪改查四種操作。
關系型資料庫對於結構化數據的處理更合適,如學生成績、地址等,這樣的數據一般情況下需要使用結構化的查詢,例如join,這樣的情況下,關系型資料庫就會比NoSQL資料庫性能更優,而且精確度更高。
由於結構化數據的規模不算太大,數據規模的增長通常也是可預期的,所以針對結構化數據使用關系型資料庫更好。關系型資料庫十分注意數據操作的事務性、一致性,如果對這方面的要求關系型資料庫無疑可以很好的滿足。
二、非關系型資料庫(NoSQL)
隨著近些年技術方向的不斷拓展,大量的NoSql資料庫如MongoDB、Redis、Memcache出於簡化資料庫結構、避免冗餘、影響性能的表連接、摒棄復雜分布式的目的被設計。
指的是分布式的、非關系型的、不保證遵循ACID原則的數據存儲系統。NoSQL資料庫技術與CAP理論、一致性哈希演算法有密切關系。所謂CAP理論,簡單來說就是一個分布式系統不可能滿足可用性、一致性與分區容錯性這三個要求,一次性滿足兩種要求是該系統的上限。
而一致性哈希演算法則指的是NoSQL資料庫在應用過程中,為滿足工作需求而在通常情況下產生的一種數據演算法,該演算法能有效解決工作方面的諸多問題但也存在弊端,即工作完成質量會隨著節點的變化而產生波動,當節點過多時,相關工作結果就無法那麼准確。
這一問題使整個系統的工作效率受到影響,導致整個資料庫系統的數據亂碼與出錯率大大提高,甚至會出現數據節點的內容遷移,產生錯誤的代碼信息。
但盡管如此,NoSQL資料庫技術還是具有非常明顯的應用優勢,如資料庫結構相對簡單,在大數據量下的讀寫性能好;能滿足隨時存儲自定義數據格式需求,非常適用於大數據處理工作。
NoSQL資料庫適合追求速度和可擴展性、業務多變的應用場景。
對於非結構化數據的處理更合適,如文章、評論,這些數據如全文搜索、機器學習通常只用於模糊處理,並不需要像結構化數據一樣,進行精確查詢,而且這類數據的數據規模往往是海量的,數據規模的增長往往也是不可能預期的;
而NoSQL資料庫的擴展能力幾乎也是無限的,所以NoSQL資料庫可以很好的滿足這一類數據的存儲。
NoSQL資料庫利用key-value可以大量的獲取大量的非結構化數據,並且數據的獲取效率很高,但用它查詢結構化數據效果就比較差。
目前NoSQL資料庫仍然沒有一個統一的標准,它現在有四種大的分類:
1、鍵值對存儲(key-value):代表軟體Redis,它的優點能夠進行數據的快速查詢,而缺點是需要存儲數據之間的關系。
2、列存儲:代表軟體Hbase,它的優點是對數據能快速查詢,數據存儲的擴展性強。而缺點是資料庫的功能有局限性。
3、文檔資料庫存儲:代表軟體MongoDB,它的優點是對數據結構要求不特別的嚴格。而缺點是查詢性的性能不好,同時缺少一種統一查詢語言。
4、圖形資料庫存儲:代表軟體InfoGrid,它的優點可以方便的利用圖結構相關演算法進行計算。而缺點是要想得到結果必須進行整個圖的計算,而且遇到不適合的數據模型時,圖形資料庫很難使用。
安全
資料庫安全涉及保護資料庫內容、其所有者和用戶的所有各個方面。它的范圍從防止有意的未經授權的資料庫使用到未經授權的實體(例如,個人或計算機程序)無意的資料庫訪問。
資料庫訪問控制涉及控制誰(一個人或某個計算機程序)可以訪問資料庫中的哪些信息。該信息可以包括特定的資料庫對象(例如,記錄類型、特定記錄、數據結構);
對特定對象的特定計算(例如,查詢類型或特定查詢),或者使用到前者的特定訪問路徑(例如,使用特定索引)或其他數據結構來訪問信息)。
資料庫訪問控制由使用專用受保護安全 DBMS 介面的特別授權(由資料庫所有者)人員設置。
這可以在個人基礎上直接管理,或者通過將個人和特權分配給組,或者(在最復雜的模型中)通過將個人和組分配給角色,然後授予權利。數據安全可防止未經授權的用戶查看或更新資料庫。使用密碼,用戶可以訪問整個資料庫或它的子集,稱為「子模式」。
例如,員工資料庫可以包含有關單個員工的所有數據,但一組用戶可能僅被授權查看工資數據,而其他用戶僅被允許訪問工作歷史和醫療數據。如果 DBMS 提供了一種互動式輸入和更新資料庫以及查詢資料庫的方法,則此功能允許管理個人資料庫。
數據安全通常涉及保護特定的數據塊,包括物理保護(即免受損壞、破壞或移除;例如,參見物理安全),或將它們或它們的一部分解釋為有意義的信息(例如,通過查看它們組成的位串,得出特定的有效信用卡號;例如,參見數據加密)。
更改和訪問日誌記錄誰訪問了哪些屬性、更改了什麼以及何時更改。日誌服務通過保留訪問發生和更改的記錄,允許以後進行取證資料庫審計。有時應用程序級代碼用於記錄更改而不是將其留給資料庫。可以設置監控以嘗試檢測安全漏洞。
以上內容參考網路-資料庫
㈤ 有關資料庫的描述,正確的是()
B
A錯,資料庫管理系統是資料庫的操作平台,和資料庫不是一個概念,設計資料庫管理系統更不靠譜了,資料庫是用來存儲書u,供人使用的,達到數據共享的目的。就好比你不能說使用軟體是為了設計操作系統吧
B對,以前由於硬體設施的限制,內存只有幾M,硬碟也不過幾十M,所以要解決存儲問題是很關鍵的.而現在科技發展迅猛,內存,硬碟已不是主要制約因素,而是實現資源共享問題!! 所以歸根結底還是共享!
數據具有獨立性,包括資料庫中資料庫的邏輯結構和應用程序相互獨立,也包括數據物理結構的變化不影響數據的邏輯結構
C錯,數據的物理結構是什麼
資料庫物理結構主要指數據的存放位置和存儲結構,包括關系、索引、聚簇、日誌、備份等的存儲安排和存儲結構
數據的邏輯結構它是用戶所看到和使用的資料庫,表示了一個或一些特定用戶使用的數據集合,即邏輯記錄的集合。 ,即存儲位置的改變並不影響邏輯關系