當前位置:首頁 » 操作系統 » 科普資料庫

科普資料庫

發布時間: 2023-08-14 01:21:10

A. 中國知網可以查到什麼

服務內容
1 、中國知識資源總庫
提供CNKI源資料庫、外文類、工業類、農業類、醫葯衛生類、經濟類和教育類多種資料庫。其中綜合性資料庫為中國期刊全文資料庫、中國博士學位論文資料庫、中國優秀碩士學位論文全文資料庫、中國重要報紙全文資料庫和中國重要會議文論全文資料庫。每個資料庫都提供初級檢索、高級檢索和專業檢索三種檢索功能。高級檢索功能最常用。
2、 數字出版平台
數字出版平台是國家「十一五」重點出版工程。數字出版平台提供學科專業數字圖書館和行業圖書館。個性化服務平台由個人數字圖書館、機構數字圖書館、數字化學習平台等。
3、文獻數據評價
2010年推出的《中國學術期刊影響因子年報》在全面研究學術期刊、博碩士學位論文、會議論文等各類文獻對學術期刊文獻的引證規律基礎上,研製者首次提出了一套全新的期刊影響因子指標體系,並制定了我國第一個公開的期刊評價指標統計標准----《<中國學術期刊影響因子年報>數據統計規范》。一系列全新的影響因子指標體系,全方位提升了各類計量指標的客觀性和准確性。研製單位還出版了「學術期刊各刊影響力統計分析資料庫」和「期刊管理部門學術期刊影響力統計分析資料庫」,統稱為《中國學術期刊影響因子年報》系列資料庫。該系列資料庫的研製出版旨在客觀、規范地評估學術期刊對科研創新的作用,為學術期刊提高辦刊質量和水平提供決策參考。「學術期刊個刊影響力評價分析資料庫」為各刊提供所發論文的學科分布、出版時滯分布與內容質量分析,並支持論文作者分析、審稿人工作績效分析等功能,有助於編輯部科學地調整辦刊方向與出版策略。 「學術期刊評價指標分析資料庫」為期刊出版管理部門和主辦單位等分析評價學術期刊學科與研究層次類型布局、期刊內容特點與質量、各類期刊發展走勢等管理工作提供決策參考。
4、 知識檢索
提供以下檢索服務:
文獻搜索
精確完整的搜索結果、獨具特色的文獻排序與聚類,是您科研的得力助手 學術定義寫論文需要引用權威的術語定義怎麼辦?CNKI學術定義搜索幫您輕松解決
數字搜索
「一切用數字說話」,CNKI數字搜索讓您的工作、生活、學習和研究變得簡單而明白 學術趨勢 關注學術熱點,展示學術發展歷程,發現經典文獻,盡在CNKI學術趨勢
翻譯助手
文獻、術語中英互譯的好幫手,詞彙句子段落應有盡有 新概念。和您分享我們自動發現學術新概念
圖形搜索
各專業珍貴的學術圖片,研究成果和復雜流程的直觀展現 表格搜索 各專業珍貴的學術圖表,為您匯總、對比各類信息數據提供方便
專業主題
168個專業主題數字圖書館,各領域學者均有屬於自己的專業知識搜索引擎大眾熱點特色熱點話題,幫您了解大眾關心的熱點知識
學術資源
全面的學術資源網站導航 紅樓夢 三國演義水滸傳
學術統計分析
對學術文獻進行績效評價及統計分析

B. 請問中國最有影響力的資料庫是哪個ISTIC、CNKI、維普

「中國知網」是集知識資源大規模整合出版、原創性學術文獻出版、多媒體出版和專業化、個性化數字圖書館為一體的數字出版平台,全面整合了我國90%以上的學術文獻和海外重要的學術文獻資料庫資源,文獻類型包括:學術期刊、博士學位論文、優秀碩士學位論文、工具書、 重要會議論文、年鑒、專著、報紙、專利、標准、科技成果、知識元、哈佛商業評論資料庫、古籍等;以網路出版和數字圖書館相結合的巨大優勢,實現了知識資源的增值服務和學術文獻的個性化與專業化的實時出版,面向全社會各行各業創新與創新管理提供知識管理服務。目前,《中國知識資源總庫》中的各類文獻資源已推廣至海內外高等院校、政府、企事業單位、醫療衛生機構、情報服務機構以及農村等各個領域,帶動了學術資源在黨政領導機關管理決策、基礎教育改革、城鄉社區公共知識服務、農村文化建設中的大量普及與應用,產生了良好的社會效益和經濟效益。為我國數字與網路出版產業的高速發展和國際化奠定了重要的基礎。
CNKI工程
中國知識基礎設施工程(China National Knowledge Infrastructure),簡稱CNKI工程,始建於1995年,是以實現全社會知識信息資源傳播共享與增值利用為目標的國家信息化重點工程,由清華大學發起,同方知網技術產業集團承擔建設,是「十一五」國家重大出版工程項目。
在黨和國家領導以及教育部、中宣部、科技部、新聞出版總署、國家版權局、國家計委的大力支持下,在全國學術界、教育界、出版界、圖書情報界等社會各界的密切配合和清華大學的直接領導下,同方知網技術產業集團經過多年努力,採用自主開發並具有國際領先水平的數字圖書館技術,建成了超大型全文資料庫《中國知識資源總庫》,以「中國知網(www.cnki.net)」為網路出版與知識服務平台,通過產業化運作,為全社會知識資源高效共享提供豐富的知識信息資源和有效的知識傳播與數字化學習平台。
「中國知網」的數字出版產品總稱為《中國知識資源總庫》,是一個採用符合國際、國家和行業技術標準的CNKI網路出版產品與技術服務標准,對各種文獻資源進行規范化、標准化加工和集成化整合而成的超大型全文資料庫。
其中,國家重點出版項目---《中國學術文獻網路出版總庫》,遵循「權威性文獻檢索工具、集成化增值性整合傳播媒體、數字化學習與研究平台、智能化專業知識倉庫、規范化學術文獻與科研績效評價工具、可二次開發的數字化資源戰略館藏」六大建設標准,按照知識網路建構模式,大規模集成整合了我國學術期刊、博碩士學位論文、會議論文、報紙、年鑒、工具書、學術圖書、專利、標准、科技成果等各類文獻資源,內容涵蓋各學科、各行業領域,囊括基礎研究、工程技術、高級科普、政策指導、行業指導、實用技術、職業指導、科技信息等各個層面,連續累積出版文獻5600多萬篇,並大量整合了互聯網上外文科技資源。此外,《中國知識資源總庫》還收錄出版了大量高等教育、基礎教育、黨建、大眾科普、政策法規、經濟信息、大眾文化、文藝作品類文獻。尤其是基於《總庫》的行業、專業與個性化數字圖書館,融合了各類先進的知識服務模式,為高效率創新、學習和管理決策創造了理想的信息化環境。

不管怎麼樣,有你自己需要的東西才是最實在的,來龍去脈沒有必要搞清楚。

C. 中國植物資料庫的介紹

中國科學院植物研究所長期開展的植物信息工程建設項目,該項目將國內植物研究信息、植物調查信息、植物經濟和社會應用信息以計算機技術收集整理建立各種形式資料庫。其目的旨在對植物調查研究和經濟利用在信息積累方面進行總結,並為植物科學研究、經濟利用、園林建設、生態旅遊、科普教育、環境和植物保護服務。中國植物資料庫建庫內容包括植物基本信息、經濟利用信息、分類系統研究信息、專題研究信息和植物圖像信息,以及與資料庫建設和服務有關的程序軟體;當前資料庫已包括5529種(包括種下分類單位)植物信息,總信息量達到4620MB。上世紀90年代以後資料庫建設重點轉向植物圖像,今後五至十年將初步建成中國植物圖像庫,進一步補充完善植物基本信息和其它植物考察利用信息,開發多功能的數據分析應用軟體,更好地發揮植物資料庫的服務應用水平。

D. 中國數字植物標本館的資料庫

1.標本信息
提供成員單位標本館所完成的數字化標本信息,包括一般標本及模式標本。每份標本信息包括標簽信息及圖像信息,前者包括標本採集人、採集日期、地點、生境與海拔以及鑒定信息和標本存放地點(標本館)等。
目前在CVH網上能查詢到中科院系統13家標本館標本,共計二百八十五萬份(筆)標本信息及一百五十五萬張標本圖像,缺乏圖像的記錄已在首頁予以標明。
網上模式標本6500份,僅包括中科院植物所標本館館藏的模式標本,包括裸子植物、毛茛科、蕁麻科、山茶科、殼斗科等類群。信息均經過核實,還附有發表新種的原始文獻(PDF格式)以及高解析度標本圖像。
分布式標本信息檢索系統:目前CVH的標本信息是通過集中式實現共享查詢的,其主要缺陷是更新周期長,存儲壓力大。我們正在試驗的分布式標本信息查詢系統已有5家標本館(稱CVH分館)參與,共有100多萬份標本信息實現實時更新,並由成員單位通過FTP自主管理其分館,有效地發揮成員單位的積極性。
2.《中國植物志》資料庫
包括全套《中國植物志》79卷(除第一卷外)125冊圖書的PDF文件,可通過科名和植物名稱(學名、中名)查詢到志書文字及圖版。最近完成的檢索文件復核補充工作使資料庫更全面准確地反映植物志的內容,除正名(accepted name)外,討論部分的學名也可查到。資料庫記錄數:45000餘條。
3.彩色圖庫
上傳到CVH網站上的植物彩色照片共計五萬余張,屬於269科5700種,為近年來眾多志願者自野外拍攝所得,范圍涉及在全國34個省(區、市)的野生植物。下階段將逐步建立彩圖鑒定專家系統,以提高照片鑒定準確性。
至此,用戶輸入學名或中名可關聯性查詢到標本、植物志及彩色圖片三大資料庫,這也是CVH的主要資料庫。
4.其他相關資料庫
為方便用戶使用標本信息,「中國數字植物標本館」網站還提供其他大量相關的(植物學)資料庫,如標本採集地名與標本館數據、分類研究人員及其研究論文題錄等。這些資料庫或源自實際工作經驗的總結、或直接轉自權威工具書並經過專家審核。
1)《中國高等植物圖鑒》資料庫
為該書全套五冊正編及兩冊補編共7本書的全文檢索。可通過科名和植物名稱(學名及中名)查詢到書中正文文字及圖畫。資料庫記錄數:9057條。
2)地方植物志及其統一查詢
提供12套地方誌的數字化文擋(PDF文件),可通過統一關聯查詢任何1-12種植物志信息,包括西藏、秦嶺、遼寧、貴州、浙江、海南等省(區/市)及地區植物志。下階段計劃實現《中國植物志》與地方植物志的關聯查詢。資料庫記錄數:47112條。
3) 「三種主要志書屬名資料庫」
提供查詢中國維管植物屬名在《中國植物志》、《中國高等植物圖鑒》和FLORA OF CHINA中的位子,包括卷冊及頁碼。這三套志書(圖鑒)是目前研究中國植物的主要參考書。該資料庫的復核工作已於最近完成,增加了新近出版 FLORA OF CHINA卷冊內容,並修改(修訂)數百條記錄,使數據更准確全面。資料庫記錄數:3504條。
4)植物名稱及分布資料庫
通過該庫可以快速查詢到中國種子植物名稱及分布信息(到省級)等簡單信息。資料主要來源於《中國植物志》和 已出版的Flora of China,可以認為是《中國植物志》的名錄修訂。目前資料庫記錄數:34056條。
5)模式標本名錄及其原始文獻資料庫
該資料庫以收集中國原生植物(Native plant)名稱模式標本及其發表原始文獻資料為宗旨,無論其模式標本採集地及保藏地在國內或國外、該名稱何時於何種刊物發表都盡量予以收錄。每條記錄包括植物名稱(學名、中名)、發表刊物,模式標本採集地點和生境、年代及標本採集人和採集號,以及標本存放地點(標本館)。大部分資料以外文形式出現。資料庫資料來源於國內外多種書刊,其中標本館代碼依 Holmgren et al.1990. Index Herbariorum和傅立國等1993《中國植物標本館索引》(中國科技出版社)。縮寫代號HT: Holotype, IT: Isotype, T: Type。目前資料庫記錄數:30705條
6)植物名稱作者(命名人)資料庫
據統計,至今為止,中國植物命名作者多達五千餘人,其中命名兩個及兩個以上名稱的有近3500人。本資料庫就是基於這3500人的資料建立的,每條記錄包括作者全名及標准縮寫、工作/出生/生卒年代、專長類群等。中國作者(共919條目)還附有中文名及工作單位。本資料庫依據國內外多種書刊資料編輯而成,其中人名拼寫標准主要依據Brummitt & Powell 1992, Authors of Plant Names。類群代碼為:A:藻類;B:苔蘚;C:孢子植物;F:化石植物;M:真菌和地衣;P:蕨類;S:種子植物。目前資料庫記錄數:3481條。
7)中國植物分類學文獻要覽(1949-1990)
一般地,查詢20世紀50年代以前中國植物學文獻時可查詢E.D.Merrill & E.H.Walker 《東亞植物學文獻目錄》(1938)及其補編(1960),90年代以後資料的查詢則多利用各種網路資源。本資料庫填補了50年代至90年代之間的空白,它主要涵蓋中國大陸學者1949-1990年間發表的植物系統學文獻,內容包括作者姓名、論著題目及發表書刊等。本庫資料主要來源於《中國植物系統學文獻要覽》(陳心啟等1993,廣東科技出版社)。目前資料庫記錄數:6879條
8)標本採集地新舊地名對照資料庫
在我國,二十世紀初以前標本採集地的名稱,現今常有改變而不再使用。在這種情形下,很有必要通過對舊時和現在地圖的核對及參考相關採集資料,來製作新舊地名對照表,建立新舊地名資料庫,包括舊地名的經緯度數據,以供標本查詢及分類學研究之用。我們根據中國植物分類學家研究經驗,總結出包括11個省(市)2000多條採集地新舊地名對照記錄。每個舊地名盡可能包括其舊外文名、位置(經緯度),並標明該地名在現今縣級行政區的名稱、國家標准代碼和經緯度。目前資料庫記錄數:2048條
9)中國植物標本館資料庫
本資料庫信息基本於《中國植物標本館索引》(傅立國等,1993)一書,共收錄全國300餘家標本館,並於最近對其中幾十家主要標本館信息進行了更新。每家標本館信息包括標本館名稱和地址、聯系人及聯系方法,館藏特色及收藏目標,以及主要研究人員信息等。
5.植物鑒定指南性資料
本部分資料庫包括互動式檢索表(又稱電子檢索表)和植物形態術語圖說等,目的是為用戶提供從植物特徵識別和標本鑒定,到上述的標本及圖像比對,一直到物種形態特徵描述和國內分布等一站式服務。
1)電子檢索表
這是一種互動的計算機程序,使用者不斷地向這個程序里輸入標本或活植物的性狀,那些不具有這些性狀的分類群將被排除掉,直到只剩下一個分類單元。它是系統植物學、生物編目與保護的一種非常好的鑒定工具。本檢索表提供檢索中國種子植物270餘個科的電子路徑。
2)科屬詞典資料庫
該庫轉接自成員單位網站,其信息來自侯寬昭主編、吳德鄰等人修訂的《中國種子植物科屬詞典》(第二版),共收集我國種子植物276科,3109屬,重點描述我國種子植物的科、屬形態、地理分布、屬種統計、主要經濟用途等。該書是我國植物學專業書籍銷量最大的圖書。其電子詞典製作的目的是為了方便用戶對植物多樣性學信息的獲取。
3)「植物鑒定和描述形態術語圖解」資料庫
包括種子植物形態術語1133條,涵蓋了植物鑒定和描述所使用的絕大部分術語,涉及根、莖、葉、花、花序、果實等植物器官。每個條目包括中、英文術語及其中英文釋義四部分內容。選詞標准規范,釋義准確、簡明扼要,大部分術語還配有一至多幅精美的線描圖(共1297幅),圖畫特徵明顯,對於讀者理解術語的含義大有裨益。本庫資料主要來源於Harris & Harris 1994, Plant Identification Terminology :An Illustrated Glossary (王宇飛等人譯,2001. 科學出版社)一書。
4)「國家重點保護野生植物名錄(第一、二批)」資料庫
第一批名錄已於一九九九年發布執行,第二批名錄經數年討論仍未正式發布,但已基本擬定,故一並列出,供用戶參考。兩個名錄共計約1900種(其中蘭科植物約佔2/3)。該庫可查詢到植物名稱(中名、學名)、科名、批次及保護等級、國內分布(到省級)、海拔高度等信息。
6.科普及孢子植物欄目(分館)
1)苔蘚植物分館和蕨類植物分館
兩者均分列中國植物名錄、植物志、名詞解釋、植物照片、專家介紹及學科通訊等相關資料,利於專門用戶查訪。
2)科普分館
主要是基於植物物種多樣性開發的科學普及常識。其中 「標本館常規技術」和「常用葯用植物」兩個欄目是我們特地為「中國數字植物標本館」所編寫的。前者包括「標本採集和壓制」、「標本裝訂」、「用檢索表鑒定植物」和「植物名稱知識介紹」等標本館常用的專業技術;後者則選錄了全國范圍內常葯用植物百餘種加於介紹。每種內容包括名稱、來源、原植物形態特徵及功能主治等。每種植物還配有一幅精美的彩色圖畫。
此外「中國數字植物標本館」還辟有「網站建設介紹」、「信息反饋」和「相關網站」等欄目,其宗旨是為用戶提供全面而便捷的信息服務。

E. sinomed系統涵蓋的資料庫有哪些

中國生物醫學文獻服務系統(SinoMed)是由中國醫學科學院醫學信息研究所/圖書館開發研製。包括以下幾個子庫:
(1)中國生物醫學文獻資料庫(CBM):收錄1978以來1600餘種中國生物醫學期刊,以及匯編、會議論文的文獻題錄770餘萬篇,全部題錄均進行主題標引和分類標引等規范化加工處理。年增文獻40餘萬篇,每月更新。 部分論文可直接鏈接到維普中文科技期刊全文庫獲取全文。
(2)中國醫學科普文獻資料庫:收錄2000年以來國內出版的醫學科普期刊近百種,文獻總量近25萬篇,重點突顯養生保健、心理健康、生殖健康、運動健身、醫學美容、婚姻家庭、食品營養等與醫學健康有關的內容。每月更新。可瀏覽全文。
(3)北京協和醫學院博碩學位論文庫:收錄1981年以來協和醫學院培養的博士、碩士研究生學位論文9700餘篇,學科範圍涉及醫學、葯學各專業領域及其他相關專業,內容前沿、豐富,可在線瀏覽全文。每季更新。可以在線瀏覽和下載文摘信息。在題錄頁面點擊「原文閱讀」可以在線閱讀全文。提示:全文不提供下載!
(4)西文生物醫學文獻資料庫(WBM):收錄目前世界各國出版的7200餘種重要生物醫學期刊文獻題錄2286萬余篇,其中協和醫學院圖書館館藏期刊4800餘種,免費期刊2400餘種。部分期刊可回溯至創刊年,全面體現協和醫學院圖書館悠久豐厚的歷史館藏。年增文獻60餘萬篇,每月更新。
(5)英文文集匯編文摘資料庫:收錄協和醫學院圖書館館藏生物醫學文集、匯編以及能夠從中析出單篇文獻的各種參考工具書等240餘種/冊,文獻量共計38700餘篇。報道內容以最新出版的文獻為主,部分文獻可回溯至2000年。每月更新。
(6)英文會議文摘資料庫:收錄2000年以來世界各主要協會、出版機構的60餘種生物醫學學術會議文獻,部分文獻有少量回溯,文獻量共計16540餘篇。每月更新。
(7)俄文生物醫學文獻資料庫:收錄1995年以來俄國出版的俄文重要生物醫學學術期刊30餘種,部分期刊有少量回溯,文獻量共計10420餘篇。每月更新。
(8)日文生物醫學文獻資料庫:收錄1995年以來日本出版的日文重要生物醫學學術期刊90餘種,部分期刊有少量回溯,文獻量共計76240餘篇。每月更新。

F. 資料庫 名詞解釋

資料庫的概念:

資料庫(Database)是按照數據結構來組織、存儲和管理數據的倉庫,它產生於距今六十多年前,隨著信息技術和市場的發展,特別是二十世紀九十年代以後,

數據管理不再僅僅是存儲和管理數據,而轉變成用戶所需要的各種數據管理的方式。資料庫有很多種類型,從最簡單的存儲有各種數據的表格到能夠進行海量數據存儲的大型資料庫系統都在各個方面得到了廣泛的應用。

在信息化社會,充分有效地管理和利用各類信息資源,是進行科學研究和決策管理的前提條件。資料庫技術是管理信息系統、辦公自動化系統、決策支持系統等各類信息系統的核心部分,是進行科學研究和決策管理的重要技術手段。

資料庫的定義:

定義1:資料庫(Database)是按照數據結構來組織、存儲和管理數據的建立在計算機存儲設備上的倉庫。

簡單來說是本身可視為電子化的文件櫃——存儲電子文件的處所,用戶可以對文件中的數據進行新增、截取、更新、刪除等操作。

在經濟管理的日常工作中,常常需要把某些相關的數據放進這樣的「倉庫」,並根據管理的需要進行相應的處理。

例如,企業或事業單位的人事部門常常要把本單位職工的基本情況(職工號、姓名、年齡、性別、籍貫、工資、簡歷等)存放在表中,這張表就可以看成是一個資料庫。有了這個"數據倉庫"我們就可以根據需要隨時查詢某職工的基本情況,也可以查詢工資在某個范圍內的職工人數等等。這些工作如果都能在計算機上自動進行,那我們的人事管理就可以達到極高的水平。此外,在財務管理、倉庫管理、生產管理中也需要建立眾多的這種"資料庫",使其可以利用計算機實現財務、倉庫、生產的自動化管理。

定義2:

嚴格來說,資料庫是長期儲存在計算機內、有組織的、可共享的數據集合。資料庫中的數據指的是以一定的數據模型組織、描述和儲存在一起、具有盡可能小的冗餘度、較高的數據獨立性和易擴展性的特點並可在一定范圍內為多個用戶共享。

這種數據集合具有如下特點:盡可能不重復,以最優方式為某個特定組織的多種應用服務,其數據結構獨立於使用它的應用程序,對數據的增、刪、改、查由統一軟體進行管理和控制。從發展的歷史看,資料庫是數據管理的高級階段,它是由文件管理系統發展起來的。[1] [2]

資料庫的處理系統:

資料庫是一個單位或是一個應用領域的通用數據處理系統,它存儲的是屬於企業和事業部門、團體和個人的有關數據的集合。資料庫中的數據是從全局觀點出發建立的,按一定的數據模型進行組織、描述和存儲。其結構基於數據間的自然聯系,從而可提供一切必要的存取路徑,且數據不再針對某一應用,而是面向全組織,具有整體的結構化特徵。

資料庫中的數據是為眾多用戶所共享其信息而建立的,已經擺脫了具體程序的限制和制約。不同的用戶可以按各自的用法使用資料庫中的數據;多個用戶可以同時共享資料庫中的數據資源,即不同的用戶可以同時存取資料庫中的同一個數據。數據共享性不僅滿足了各用戶對信息內容的要求,同時也滿足了各用戶之間信息通信的要求。

資料庫的基本結構:

資料庫的基本結構分三個層次,反映了觀察資料庫的三種不同角度。

以內模式為框架所組成的資料庫叫做物理資料庫;以概念模式為框架所組成的數據叫概念資料庫;以外模式為框架所組成的資料庫叫用戶資料庫。

⑴ 物理數據層。

它是資料庫的最內層,是物理存貯設備上實際存儲的數據的集合。這些數據是原始數據,是用戶加工的對象,由內部模式描述的指令操作處理的位串、字元和字組成。

⑵ 概念數據層。

它是資料庫的中間一層,是資料庫的整體邏輯表示。指出了每個數據的邏輯定義及數據間的邏輯聯系,是存貯記錄的集合。它所涉及的是資料庫所有對象的邏輯關系,而不是它們的物理情況,是資料庫管理員概念下的資料庫。

⑶ 用戶數據層。

它是用戶所看到和使用的資料庫,表示了一個或一些特定用戶使用的數據集合,即邏輯記錄的集合。

資料庫不同層次之間的聯系是通過映射進行轉換的。

資料庫的主要特點:

⑴ 實現數據共享

數據共享包含所有用戶可同時存取資料庫中的數據,也包括用戶可以用各種方式通過介面使用資料庫,並提供數據共享。

⑵ 減少數據的冗餘度

同文件系統相比,由於資料庫實現了數據共享,從而避免了用戶各自建立應用文件。減少了大量重復數據,減少了數據冗餘,維護了數據的一致性。

⑶ 數據的獨立性

數據的獨立性包括邏輯獨立性(資料庫中資料庫的邏輯結構和應用程序相互獨立)和物理獨立性(數據物理結構的變化不影響數據的邏輯結構)。

⑷ 數據實現集中控制

文件管理方式中,數據處於一種分散的狀態,不同的用戶或同一用戶在不同處理中其文件之間毫無關系。利用資料庫可對數據進行集中控制和管理,並通過數據模型表示各種數據的組織以及數據間的聯系。

⑸數據一致性和可維護性,以確保數據的安全性和可靠性

主要包括:①安全性控制:以防止數據丟失、錯誤更新和越權使用;②完整性控制:保證數據的正確性、有效性和相容性;③並發控制:使在同一時間周期內,允許對數據實現多路存取,又能防止用戶之間的不正常交互作用。

⑹ 故障恢復

由資料庫管理系統提供一套方法,可及時發現故障和修復故障,從而防止數據被破壞。資料庫系統能盡快恢復資料庫系統運行時出現的故障,可能是物理上或是邏輯上的錯誤。比如對系統的誤操作造成的數據錯誤等。

資料庫的數據種類:

資料庫通常分為層次式資料庫、網路式資料庫和關系式資料庫三種。而不同的資料庫是按不同的數據結構來聯系和組織的。

1.數據結構模型

⑴數據結構

所謂數據結構是指數據的組織形式或數據之間的聯系。

如果用D表示數據,用R表示數據對象之間存在的關系集合,則將DS=(D,R)稱為數據結構。

例如,設有一個電話號碼簿,它記錄了n個人的名字和相應的電話號碼。為了方便地查找某人的電話號碼,將人名和號碼按字典順序排列,並在名字的後面跟隨著對應的電話號碼。這樣,若要查找某人的電話號碼(假定他的名字的第一個字母是Y),那麼只須查找以Y開頭的那些名字就可以了。該例中,數據的集合D就是人名和電話號碼,它們之間的聯系R就是按字典順序的排列,其相應的數據結構就是DS=(D,R),即一個數組。

⑵數據結構類型

數據結構又分為數據的邏輯結構和數據的物理結構。

數據的邏輯結構是從邏輯的角度(即數據間的聯系和組織方式)來觀察數據,分析數據,與數據的存儲位置無關;數據的物理結構是指數據在計算機中存放的結構,即數據的邏輯結構在計算機中的實現形式,所以物理結構也被稱為存儲結構。

這里只研究數據的邏輯結構,並將反映和實現數據聯系的方法稱為數據模型。

比較流行的數據模型有三種,即按圖論理論建立的層次結構模型和網狀結構模型以及按關系理論建立的關系結構模型。

2.層次、網狀和關系資料庫系統

⑴層次結構模型

層次結構模型實質上是一種有根結點的定向有序樹(在數學中"樹"被定義為一個無回的連通圖)。下圖是一個高等學校的組織結構圖。這個組織結構圖像一棵樹,校部就是樹根(稱為根結點),各系、專業、教師、學生等為枝點(稱為結點),樹根與枝點之間的聯系稱為邊,樹根與邊之比為1:N,即樹根只有一個,樹枝有N個。

按照層次模型建立的資料庫系統稱為層次模型資料庫系統。IMS(Information Management System)是其典型代表。

⑵網狀結構模型

按照網狀數據結構建立的資料庫系統稱為網狀資料庫系統,其典型代表是DBTG(Database Task Group)。用數學方法可將網狀數據結構轉化為層次數據結構。

⑶ 關系結構模型

關系式數據結構把一些復雜的數據結構歸結為簡單的二元關系(即二維表格形式)。例如某單位的職工關系就是一個二元關系。

由關系數據結構組成的資料庫系統被稱為關系資料庫系統。

在關系資料庫中,對數據的操作幾乎全部建立在一個或多個關系表格上,通過對這些關系表格的分類、合並、連接或選取等運算來實現數據的管理。

dBASEⅡ就是這類資料庫管理系統的典型代表。對於一個實際的應用問題(如人事管理問題),有時需要多個關系才能實現。用dBASEⅡ建立起來的一個關系稱為一個資料庫(或稱資料庫文件),而把對應多個關系建立起來的多個資料庫稱為資料庫系統。dBASEⅡ的另一個重要功能是通過建立命令文件來實現對資料庫的使用和管理,對於一個資料庫系統相應的命令序列文件,稱為該資料庫的應用系統。

因此,可以概括地說,一個關系稱為一個資料庫,若干個資料庫可以構成一個資料庫系統。資料庫系統可以派生出各種不同類型的輔助文件和建立它的應用系統。

資料庫的發展簡史:

1 資料庫的技術發展

使用計算機後,隨著數據處理量的增長,產生了數據管理技術。數據管理技術的發展與計算機硬體(主要是外部存儲器)系統軟體及計算機應用的范圍有著密切的聯系。數據管理技術的發展經歷了以下四個階段:人工管理階段、文件系統階段、資料庫階段和高級資料庫技術階段 。

2 數據管理的誕生

資料庫的歷史可以追溯到五十年前,那時的數據管理非常簡單。通過大量的分類、比較和表格繪制的機器運行數百萬穿孔卡片來進行數據的處理,其運行結果在紙上列印出來或者製成新的穿孔卡片。而數據管理就是對所有這些穿孔卡片進行物理的儲存和處理。然而,1950 年雷明頓蘭德公司(Remington Rand Inc)的一種叫做Univac I 的計算機推出了一種一秒鍾可以輸入數百條記錄的磁帶驅動器,從而引發了數據管理的革命。1956 年IBM生產出第一個磁碟驅動器—— the Model 305 RAMAC。此驅動器有50 個碟片,每個碟片直徑是2 英尺,可以儲存5MB的數據。使用磁碟最大的好處是可以隨機存取數據,而穿孔卡片和磁帶只能順序存取數據。

1951: Univac系統使用磁帶和穿孔卡片作為數據存儲。

資料庫系統的萌芽出現於二十世紀60 年代。當時計算機開始廣泛地應用於數據管理,對數據的共享提出了越來越高的要求。傳統的文件系統已經不能滿足人們的需要,能夠統一管理和共享數據的資料庫管理系統(DBMS)應運而生。數據模型是資料庫系統的核心和基礎,各種DBMS軟體都是基於某種數據模型的。所以通常也按照數據模型的特點將傳統資料庫系統分成網狀資料庫、層次資料庫和關系資料庫三類。

最早出現的網狀DBMS,是美國通用電氣公司Bachman等人在1961年開發的IDS(Integrated Data Store)。1964年通用電氣公司(General ElectricCo.)的Charles Bachman 成功地開發出世界上第一個網狀DBMS也即第一個資料庫管理系統——集成數據存儲(Integrated Data Store IDS),奠定了網狀資料庫的基礎,並在當時得到了廣泛的發行和應用。IDS 具有數據模式和日誌的特徵,但它只能在GE主機上運行,並且資料庫只有一個文件,資料庫所有的表必須通過手工編碼生成。之後,通用電氣公司一個客戶——BF Goodrich Chemical 公司最終不得不重寫了整個系統,並將重寫後的系統命名為集成數據管理系統(IDMS)。

網狀資料庫模型對於層次和非層次結構的事物都能比較自然的模擬,在關系資料庫出現之前網狀DBMS要比層次DBMS用得普遍。在資料庫發展史上,網狀資料庫佔有重要地位。

層次型DBMS是緊隨網路型資料庫而出現的,最著名最典型的層次資料庫系統是IBM 公司在1968 年開發的IMS(Information Management System),一種適合其主機的層次資料庫。這是IBM公司研製的最早的大型資料庫系統程序產品。從60年代末產生起,如今已經發展到IMSV6,提供群集、N路數據共享、消息隊列共享等先進特性的支持。這個具有30年歷史的資料庫產品在如今的WWW應用連接、商務智能應用中扮演著新的角色。

1973年Cullinane公司(也就是後來的Cullinet軟體公司),開始出售Goodrich公司的IDMS改進版本,並且逐漸成為當時世界上最大的軟體公司。

資料庫的關系由來:

網狀資料庫和層次資料庫已經很好地解決了數據的集中和共享問題,但是在數據獨立性和抽象級別上仍有很大欠缺。用戶在對這兩種資料庫進行存取時,仍然需要明確數據的存儲結構,指出存取路徑。而後來出現的關系資料庫較好地解決了這些問題。

1970年,IBM的研究員E.F.Codd博士在刊物《Communication of the ACM》上發表了一篇名為「A Relational Model of Data for Large Shared Data Banks」的論文,提出了關系模型的概念,奠定了關系模型的理論基礎。盡管之前在1968年Childs已經提出了面向集合的模型,然而這篇論文被普遍認為是資料庫系統歷史上具有劃時代意義的里程碑。Codd的心願是為資料庫建立一個優美的數據模型。後來Codd又陸續發表多篇文章,論述了範式理論和衡量關系系統的12條標准,用數學理論奠定了關系資料庫的基礎。關系模型有嚴格的數學基礎,抽象級別比較高,而且簡單清晰,便於理解和使用。但是當時也有人認為關系模型是理想化的數據模型,用來實現DBMS是不現實的,尤其擔心關系資料庫的性能難以接受,更有人視其為當時正在進行中的網狀資料庫規范化工作的嚴重威脅。為了促進對問題的理解,1974年ACM牽頭組織了一次研討會,會上開展了一場分別以Codd和Bachman為首的支持和反對關系資料庫兩派之間的辯論。這次著名的辯論推動了關系資料庫的發展,使其最終成為現代資料庫產品的主流。

1969年Edgar F.「Ted」 Codd發明了關系資料庫。

1970年關系模型建立之後,IBM公司在San Jose實驗室增加了更多的研究人員研究這個項目,這個項目就是著名的System R。其目標是論證一個全功能關系DBMS的可行性。該項目結束於1979年,完成了第一個實現SQL的 DBMS。然而IBM對IMS的承諾阻止了System R的投產,一直到1980年System R才作為一個產品正式推向市場。IBM產品化步伐緩慢的三個原因:IBM重視信譽,重視質量,盡量減少故障;IBM是個大公司,官僚體系龐大,IBM內部已經有層次資料庫產品,相關人員不積極,甚至反對。

然而同時,1973年加州大學伯克利分校的Michael Stonebraker和Eugene Wong利用System R已發布的信息開始開發自己的關系資料庫系統Ingres。他們開發的Ingres項目最後由Oracle公司、Ingres公司以及矽谷的其他廠商所商品化。後來,System R和Ingres系統雙雙獲得ACM的1988年「軟體系統獎」。

1976年霍尼韋爾公司(Honeywell)開發了第一個商用關系資料庫系統——Multics Relational Data Store。關系型資料庫系統以關系代數為堅實的理論基礎,經過幾十年的發展和實際應用,技術越來越成熟和完善。其代表產品有Oracle、IBM公司的 DB2、微軟公司的MS SQL Server以及Informix、ADABAS D等等。

資料庫的發展階段:

資料庫發展階段大致劃分為如下的幾個階段:人工管理階段、文件系統階段、資料庫系統階段、高級資料庫階段。

人工管理階段

20世紀50年代中期之前,計算機的軟硬體均不完善。硬體存儲設備只有磁帶、卡片和紙帶,軟體方面還沒有操作系統,當時的計算機主要用於科學計算。這個階段由於還沒有軟體系統對數據進行管理,程序員在程序中不僅要規定數據的邏輯結構,還要設計其物理結構,包括存儲結構、存取方法、輸入輸出方式等。當數據的物理組織或存儲設備改變時,用戶程序就必須重新編制。由於數據的組織面向應用,不同的計算程序之間不能共享數據,使得不同的應用之間存在大量的重復數據,很難維護應用程序之間數據的一致性。

這一階段的主要特徵可歸納為如下幾點:

(1)計算機中沒有支持數據管理的軟體,計算機系統不提供對用戶數據的管理功能,應用程序只包含自己要用到的全部數據。用戶編製程序,必須全面考慮好相關的數據,包括數據的定義、存儲結構以即存取方法等。程序和數據是一個不可分割的整體。數據脫離了程序極具無任何存在的價值,數據無獨立性。

(2)數據不能共享。不同的程序均有各自的數據,這些數據對不同的程序通常是不相同的,不可共享;即使不同的程序使用了相同的一組數據,這些數據也不能共享,程序中仍然需要各自加入這組數據,哪個部分都不能省略。基於這種數據的不可共享性,必然導致程序與程序之間存在大量的重復數據,浪費存儲空間。

(3)不能單獨保存數據。在程序中要規定數據的邏輯結構和物理結構,數據與程序不獨立。基於數據與程序是一個整體,數據只為本程序所使用,數據只有與相應的程序一起保存才有價值,否則毫無用處。所以,所有程序的數據不單獨保存。數據處理的方式是批處理。

文件系統階段:

這一階段的主要標志是計算機中有了專門管理資料庫的軟體——操作系統(文件管理)。

上世紀50年代中期到60年代中期,由於計算機大容量直接存儲設備如硬碟、磁鼓的出現,

推動了軟體技術的發展,軟體的領域出現了操作系統和高級軟體,操作系統中的文件系統是專門管理外存的數據管理軟體,操作系統為用戶使用文件提供了友好界面。操作系統的出現標志著數據管理步入一個新的階段。在文件系統階段,數據以文件為單位存儲在外存,且由操作系統統一管理,文件是操作系統管理的重要資源。

文件系統階段的數據管理具有一下幾個特點:

優點

(1)數據以「文件」形式可長期保存在外部存儲器的磁碟上。由於計算機的應用轉向信息管理,因此對文件要進行大量的查詢、修改和插入等操作。

(2)數據的邏輯結構與物理結構有了區別,程序和數據分離,使數據與程序有了一定的獨立性,但比較簡單。數據的邏輯結構是指呈現在用戶面前的數據結構形式。數據的物理結構是指數據在計算機存儲設備上的實際存儲結構。程度與數據之間具有「設備獨立性」,即程序只需用文件名就可與數據打交道,不必關心數據的物理位置。由操作系統的文件系統提供存取方法(讀/寫)。

(3)文件組織已多樣化。有索引文件、鏈接文件和直接存取文件等。但文件之間相互獨立、缺乏聯系。數據之間的聯系需要通過程序去構造。

(4)數據不再屬於某個特定的程序,可以重復使用,即數據面向應用。但是文件結構的設計仍是基於特定的用途,程序基於特定的物理結構和存取方法,因此程度與數據結構之間的依賴關系並未根本改變。

(5)用戶的程序與數據可分別存放在外存儲器上,各個應用程序可以共享一組數據,實現了以文件為單位的數據共享文件系統。

(6)對數據的操作以記錄為單位。這是由於文件中只存儲數據,不存儲文件記錄的結構描述信息。文件的建立、存取、查詢、插入、刪除、修改等操作,都要用程序來實現。

(7)數據處理方式有批處理,也有聯機實時處理。

缺點

文件系統對計算機數據管理能力的提高雖然起了很大的作用,但隨著數據管理規模的擴大,數據量急劇增加,文價系統顯露出一些缺陷,問題表現在:

(1)數據文件是為了滿足特定業務領域某一部門的專門需要而設計,數據和程序相互依賴,數據缺乏足夠的獨立性。

(2)數據沒有集中管理的機制,其安全性和完整性無法保障,數據維護業務仍然由應用程序來承擔;

(3)數據的組織仍然是面向程序,數據與程序的依賴性強,數據的邏輯結構不能方便地修改和擴充,數據邏輯結構的每一點微小改變都會影響到應用程序;而且文件之間的缺乏聯系,因而它們不能反映現實世界中事物之間的聯系,加上操作系統不負責維護文件之間的聯系,信息造成每個應用程序都有相對應的文件。如果文件之間有內容上的聯系,那也只能由應用程序去處理,有可能同樣的數據在多個文件中重復儲存。這兩者造成了大量的數據冗餘。

(4)對現有數據文件不易擴充,不易移植,難以通過增、刪數據項來適應新的應用要求。

資料庫系統階段:

20世紀60年代後期,隨著計算機在數據管理領域的普遍應用,人們對數據管理技術提出了更高的要求:希望面向企業或部門,以數據為中心組織數據,減少數據的冗餘,提供更高的數據共享能力,同時要求程序和數據具有較高的獨立性,當數據的邏輯結構改變時,不涉及數據的物理結構,也不影響應用程序,以降低應用程序研製與維護的費用。資料庫技術正是在這樣一個應用需求的基礎上發展起來的。

概括起來,資料庫系統階段的數據管理具有以下幾個特點:

(1)採用數據模型表示復雜的數據結構。數據模型不僅描述數據本身的特徵,還要描述數據之間的聯系,這種聯系通過所有存取路徑。通過所有存儲路徑表示自然的數據聯系是資料庫與傳統文件的根本區別。這樣,數據不再面向特定的某個或多個應用,而是面對整個應用系統。如面向企業或部門,以數據為中心組織數據,形成綜合性的資料庫,為各應用共享。

(2)由於面對整個應用系統使得,數據冗餘小,易修改、易擴充,實現了數據貢獻。不同的應用程序根據處理要求,從資料庫中獲取需要的數據,這樣就減少了數據的重復存儲,也便於增加新的數據結構,便於維護數據的一致性。

(3)對數據進行統一管理和控制,提供了數據的安全性、完整性、以及並發控制。

(4)程序和數據有較高的獨立性。數據的邏輯結構與物理結構之間的差別可以很大,用戶以簡單的邏輯結構操作數據而無須考慮數據的物理結構。

(5)具有良好的用戶介面,用戶可方便地開發和使用資料庫。

從文件系統發展到資料庫系統,這在信息領域中具有里程碑的意義。在文件系統階段,人們在信息處理中關注的中心問題是系統功能的設計,因此程序設計佔主導地位;而在資料庫方式下,數據開始占據了中心位置,數據的結構設計成為信息系統首先關心的問題,而應用程序則以既定的數據結構為基礎進行設計。

資料庫發展趨勢:

隨著信息管理內容的不斷擴展,出現了豐富多樣的數據模型(層次模型,網狀模型,關系模型,面向對象模型,半結構化模型等),新技術也層出不窮(數據流,Web數據管理,數據挖掘等)。每隔幾年,國際上一些資深的資料庫專家就會聚集一堂,探討資料庫研究現狀,存在的問題和未來需要關注的新技術焦點。過去已有的幾個類似報告包括:1989年Future Directions inDBMS Research-The Laguna BeachParticipants ;1990年DatabaseSystems : Achievements and Opportunities ;1991年W.H. Inmon 發表的《構建數據倉庫》;1995年Database。

常見資料庫廠商:

1. SQL Server

只能在windows上運行,沒有絲毫的開放性,操作系統的系統的穩定對資料庫是十分重要的。Windows9X系列產品是偏重於桌面應用,NT server只適合中小型企業。而且windows平台的可靠性,安全性和伸縮性是非常有限的。它不象unix那樣久經考驗,尤其是在處理大資料庫。

2. Oracle

能在所有主流平台上運行(包括 windows)。完全支持所有的工業標准。採用完全開放策略。可以使客戶選擇最適合的解決方案。對開發商全力支持。

3. Sybase ASE

能在所有主流平台上運行(包括 windows)。 但由於早期Sybase與OS集成度不高,因此VERSION11.9.2以下版本需要較多OS和DB級補丁。在多平台的混合環境中,會有一定問題。

4. DB2

能在所有主流平台上運行(包括windows)。最適於海量數據。DB2在企業級的應用最為廣泛,在全球的500家最大的企業中,幾乎85%以上用DB2資料庫伺服器,而國內到97年約佔5%。

熱點內容
java的component 發布:2025-03-11 04:37:09 瀏覽:767
愛奇藝同時能緩存幾個 發布:2025-03-11 04:32:58 瀏覽:927
vn裡面的伺服器地址是啥 發布:2025-03-11 04:28:47 瀏覽:694
演算法導論翻譯 發布:2025-03-11 04:28:43 瀏覽:150
神奇伺服器我的世界 發布:2025-03-11 04:26:50 瀏覽:184
xt5輕混選哪個配置 發布:2025-03-11 03:55:43 瀏覽:794
java獲取ftp文件列表 發布:2025-03-11 03:53:56 瀏覽:553
linux查看配置命令 發布:2025-03-11 03:52:13 瀏覽:917
python怎樣 發布:2025-03-11 03:37:45 瀏覽:437
備忘錄手繪在哪裡打開安卓 發布:2025-03-11 03:36:03 瀏覽:847