資料庫宗旨
『壹』 為什麼萬方資料庫的論文只有導出項,沒有下載項啊
如果萬方資料庫的某些論文只有導出而沒有下載鏈接的,是因為萬方資料庫的某些論文沒有獲得該篇論文的授權。你讀者可以到國家科技圖書文獻中心(NSTL)檢索查詢,再根據查詢的結果請求授權復制。
『貳』 中國數字植物標本館的資料庫
1.標本信息
提供成員單位標本館所完成的數字化標本信息,包括一般標本及模式標本。每份標本信息包括標簽信息及圖像信息,前者包括標本採集人、採集日期、地點、生境與海拔以及鑒定信息和標本存放地點(標本館)等。
目前在CVH網上能查詢到中科院系統13家標本館標本,共計二百八十五萬份(筆)標本信息及一百五十五萬張標本圖像,缺乏圖像的記錄已在首頁予以標明。
網上模式標本6500份,僅包括中科院植物所標本館館藏的模式標本,包括裸子植物、毛茛科、蕁麻科、山茶科、殼斗科等類群。信息均經過核實,還附有發表新種的原始文獻(PDF格式)以及高解析度標本圖像。
分布式標本信息檢索系統:目前CVH的標本信息是通過集中式實現共享查詢的,其主要缺陷是更新周期長,存儲壓力大。我們正在試驗的分布式標本信息查詢系統已有5家標本館(稱CVH分館)參與,共有100多萬份標本信息實現實時更新,並由成員單位通過FTP自主管理其分館,有效地發揮成員單位的積極性。
2.《中國植物志》資料庫
包括全套《中國植物志》79卷(除第一卷外)125冊圖書的PDF文件,可通過科名和植物名稱(學名、中名)查詢到志書文字及圖版。最近完成的檢索文件復核補充工作使資料庫更全面准確地反映植物志的內容,除正名(accepted name)外,討論部分的學名也可查到。資料庫記錄數:45000餘條。
3.彩色圖庫
上傳到CVH網站上的植物彩色照片共計五萬余張,屬於269科5700種,為近年來眾多志願者自野外拍攝所得,范圍涉及在全國34個省(區、市)的野生植物。下階段將逐步建立彩圖鑒定專家系統,以提高照片鑒定準確性。
至此,用戶輸入學名或中名可關聯性查詢到標本、植物志及彩色圖片三大資料庫,這也是CVH的主要資料庫。
4.其他相關資料庫
為方便用戶使用標本信息,「中國數字植物標本館」網站還提供其他大量相關的(植物學)資料庫,如標本採集地名與標本館數據、分類研究人員及其研究論文題錄等。這些資料庫或源自實際工作經驗的總結、或直接轉自權威工具書並經過專家審核。
1)《中國高等植物圖鑒》資料庫
為該書全套五冊正編及兩冊補編共7本書的全文檢索。可通過科名和植物名稱(學名及中名)查詢到書中正文文字及圖畫。資料庫記錄數:9057條。
2)地方植物志及其統一查詢
提供12套地方誌的數字化文擋(PDF文件),可通過統一關聯查詢任何1-12種植物志信息,包括西藏、秦嶺、遼寧、貴州、浙江、海南等省(區/市)及地區植物志。下階段計劃實現《中國植物志》與地方植物志的關聯查詢。資料庫記錄數:47112條。
3) 「三種主要志書屬名資料庫」
提供查詢中國維管植物屬名在《中國植物志》、《中國高等植物圖鑒》和FLORA OF CHINA中的位子,包括卷冊及頁碼。這三套志書(圖鑒)是目前研究中國植物的主要參考書。該資料庫的復核工作已於最近完成,增加了新近出版 FLORA OF CHINA卷冊內容,並修改(修訂)數百條記錄,使數據更准確全面。資料庫記錄數:3504條。
4)植物名稱及分布資料庫
通過該庫可以快速查詢到中國種子植物名稱及分布信息(到省級)等簡單信息。資料主要來源於《中國植物志》和 已出版的Flora of China,可以認為是《中國植物志》的名錄修訂。目前資料庫記錄數:34056條。
5)模式標本名錄及其原始文獻資料庫
該資料庫以收集中國原生植物(Native plant)名稱模式標本及其發表原始文獻資料為宗旨,無論其模式標本採集地及保藏地在國內或國外、該名稱何時於何種刊物發表都盡量予以收錄。每條記錄包括植物名稱(學名、中名)、發表刊物,模式標本採集地點和生境、年代及標本採集人和採集號,以及標本存放地點(標本館)。大部分資料以外文形式出現。資料庫資料來源於國內外多種書刊,其中標本館代碼依 Holmgren et al.1990. Index Herbariorum和傅立國等1993《中國植物標本館索引》(中國科技出版社)。縮寫代號HT: Holotype, IT: Isotype, T: Type。目前資料庫記錄數:30705條
6)植物名稱作者(命名人)資料庫
據統計,至今為止,中國植物命名作者多達五千餘人,其中命名兩個及兩個以上名稱的有近3500人。本資料庫就是基於這3500人的資料建立的,每條記錄包括作者全名及標准縮寫、工作/出生/生卒年代、專長類群等。中國作者(共919條目)還附有中文名及工作單位。本資料庫依據國內外多種書刊資料編輯而成,其中人名拼寫標准主要依據Brummitt & Powell 1992, Authors of Plant Names。類群代碼為:A:藻類;B:苔蘚;C:孢子植物;F:化石植物;M:真菌和地衣;P:蕨類;S:種子植物。目前資料庫記錄數:3481條。
7)中國植物分類學文獻要覽(1949-1990)
一般地,查詢20世紀50年代以前中國植物學文獻時可查詢E.D.Merrill & E.H.Walker 《東亞植物學文獻目錄》(1938)及其補編(1960),90年代以後資料的查詢則多利用各種網路資源。本資料庫填補了50年代至90年代之間的空白,它主要涵蓋中國大陸學者1949-1990年間發表的植物系統學文獻,內容包括作者姓名、論著題目及發表書刊等。本庫資料主要來源於《中國植物系統學文獻要覽》(陳心啟等1993,廣東科技出版社)。目前資料庫記錄數:6879條
8)標本採集地新舊地名對照資料庫
在我國,二十世紀初以前標本採集地的名稱,現今常有改變而不再使用。在這種情形下,很有必要通過對舊時和現在地圖的核對及參考相關採集資料,來製作新舊地名對照表,建立新舊地名資料庫,包括舊地名的經緯度數據,以供標本查詢及分類學研究之用。我們根據中國植物分類學家研究經驗,總結出包括11個省(市)2000多條採集地新舊地名對照記錄。每個舊地名盡可能包括其舊外文名、位置(經緯度),並標明該地名在現今縣級行政區的名稱、國家標准代碼和經緯度。目前資料庫記錄數:2048條
9)中國植物標本館資料庫
本資料庫信息基本於《中國植物標本館索引》(傅立國等,1993)一書,共收錄全國300餘家標本館,並於最近對其中幾十家主要標本館信息進行了更新。每家標本館信息包括標本館名稱和地址、聯系人及聯系方法,館藏特色及收藏目標,以及主要研究人員信息等。
5.植物鑒定指南性資料
本部分資料庫包括互動式檢索表(又稱電子檢索表)和植物形態術語圖說等,目的是為用戶提供從植物特徵識別和標本鑒定,到上述的標本及圖像比對,一直到物種形態特徵描述和國內分布等一站式服務。
1)電子檢索表
這是一種互動的計算機程序,使用者不斷地向這個程序里輸入標本或活植物的性狀,那些不具有這些性狀的分類群將被排除掉,直到只剩下一個分類單元。它是系統植物學、生物編目與保護的一種非常好的鑒定工具。本檢索表提供檢索中國種子植物270餘個科的電子路徑。
2)科屬詞典資料庫
該庫轉接自成員單位網站,其信息來自侯寬昭主編、吳德鄰等人修訂的《中國種子植物科屬詞典》(第二版),共收集我國種子植物276科,3109屬,重點描述我國種子植物的科、屬形態、地理分布、屬種統計、主要經濟用途等。該書是我國植物學專業書籍銷量最大的圖書。其電子詞典製作的目的是為了方便用戶對植物多樣性學信息的獲取。
3)「植物鑒定和描述形態術語圖解」資料庫
包括種子植物形態術語1133條,涵蓋了植物鑒定和描述所使用的絕大部分術語,涉及根、莖、葉、花、花序、果實等植物器官。每個條目包括中、英文術語及其中英文釋義四部分內容。選詞標准規范,釋義准確、簡明扼要,大部分術語還配有一至多幅精美的線描圖(共1297幅),圖畫特徵明顯,對於讀者理解術語的含義大有裨益。本庫資料主要來源於Harris & Harris 1994, Plant Identification Terminology :An Illustrated Glossary (王宇飛等人譯,2001. 科學出版社)一書。
4)「國家重點保護野生植物名錄(第一、二批)」資料庫
第一批名錄已於一九九九年發布執行,第二批名錄經數年討論仍未正式發布,但已基本擬定,故一並列出,供用戶參考。兩個名錄共計約1900種(其中蘭科植物約佔2/3)。該庫可查詢到植物名稱(中名、學名)、科名、批次及保護等級、國內分布(到省級)、海拔高度等信息。
6.科普及孢子植物欄目(分館)
1)苔蘚植物分館和蕨類植物分館
兩者均分列中國植物名錄、植物志、名詞解釋、植物照片、專家介紹及學科通訊等相關資料,利於專門用戶查訪。
2)科普分館
主要是基於植物物種多樣性開發的科學普及常識。其中 「標本館常規技術」和「常用葯用植物」兩個欄目是我們特地為「中國數字植物標本館」所編寫的。前者包括「標本採集和壓制」、「標本裝訂」、「用檢索表鑒定植物」和「植物名稱知識介紹」等標本館常用的專業技術;後者則選錄了全國范圍內常葯用植物百餘種加於介紹。每種內容包括名稱、來源、原植物形態特徵及功能主治等。每種植物還配有一幅精美的彩色圖畫。
此外「中國數字植物標本館」還辟有「網站建設介紹」、「信息反饋」和「相關網站」等欄目,其宗旨是為用戶提供全面而便捷的信息服務。
『叄』 數據倉庫的發展前期
計算機發展的早期,人們已經提出了建立數據倉庫的構想。「數據倉庫」一詞最早是在1990年,由Bill Inmon先生提出的,其描述如下:數據倉庫是為支持企業決策而特別設計和建立的數據集合。
企業建立數據倉庫是為了填補現有數據存儲形式已經不能滿足信息分析的需要。數據倉庫理論中的一個核心理念就是:事務型數據和決策支持型數據的處理性能不同。
企業在它們的事務操作收集數據。在企業運作過程中:隨著定貨、銷售記錄的進行,這些事務型數據也連續的產生。為了引入數據,我們必須優化事務型資料庫。
處理決策支持型數據時,一些問題經常會被提出:哪類客戶會購買哪類產品?促銷後銷售額會變化多少?價格變化後或者商店地址變化後銷售額又會變化多少呢?在某一段時間內,相對其他產品來說哪類產品特別容易賣呢?哪些客戶增加了他們的購買額?哪些客戶又削減了他們的購買額呢?
事務型資料庫可以為這些問題作出解答,但是它所給出的答案往往並不能讓人十分滿意。在運用有限的計算機資源時常常存在著競爭。在增加新信息的時候我們需要事務型資料庫是空閑的。而在解答一系列具體的有關信息分析的問題的時候,系統處理新數據的有效性又會被大大降低。另一個問題就在於事務型數據總是在動態的變化之中的。決策支持型處理需要相對穩定的數據,從而問題都能得到一致連續的解答。
數據倉庫的解決方法包括:將決策支持型數據處理從事務型數據處理中分離出來。數據按照一定的周期(通常在每晚或者每周末),從事務型資料庫中導入決策支持型資料庫——既「數據倉庫」。數據倉庫是按回答企業某方面的問題來分「主題」組織數據的,這是最有效的數據組織方式。