當前位置:首頁 » 操作系統 » 化石資料庫

化石資料庫

發布時間: 2024-03-26 21:32:26

『壹』 古生物化石標本資料庫的服務對象有哪些

古生物化石標本資料庫是國土資源部按照《古生物化石保護條例》有關規定,組織古生物化石管理、標本館藏、研究和信息技術等相關領域的力量共同建立的。該系統的建設目標分為長期目標和近期目標兩種。

長期目標的服務對象主要包括4個方面,即《古生物化石保護條例》規定的各級國土資源主管部門、古生物化石標本館藏單位、古生物化石研究單位和普通公眾。長期目標具體為:第一,滿足各級主管部門開展古生物化石標本管理工作中對現有標本的信息需求,例如,不同門類、不同地域、不同時代的化石標本數量、分布、保存現狀、流轉歷史,甚至單件化石標本的詳細情況等;第二,滿足收藏單位自身日常管理的需要,如標本庫存登記、借出登記、流轉登記等;第三,為科研單位開展科學研究提供便利,如研究人員可以從大量標本數據中提煉出共性信息;第四,滿足普通公眾對化石科普信息的需求,例如,項目組將針對部分重要門類的化石編寫科普詞條,並與資料庫建立關聯,方便普通公眾建立基本的生物進化及地質歷史概念。

為滿足當前急需,近期目標在2015年前完成,服務對象只包括兩個方面,即兩級主管部門(國土資源部及各省、自治區、直轄市國土資源廳)和收藏單位。近期目標具體為:第一,滿足兩級主管部門掌握各自管轄范圍內重點保護古生物化石標本的基本情況需求,如數量、分布等,以及出入境化石標本的基本信息;第二,對於目前沒有建立收藏標本資料庫的單位,按照統一要求建立標本資料庫,實現標本日常管理;對於已經建立並應用標本資料庫的單位,通過開發介面的方式妥善解決兩套系統之間的自動關聯與更新機制,在盡可能不影響對原有系統使用的情況下,實現收藏標本數據與兩級主管部門之間的數據連通與更新。

『貳』 數據管理技術的發展趨勢是什麼

20世紀50年代中期以前,計算機主要用於科學計算。硬體方面,計算機的外存只有磁帶、卡片、紙帶,沒有磁碟等直接存取的存儲設備,存儲量非常小;軟體方面,沒有操作系統,沒有高級語言,數據處理的方式是批處理,也即機器一次處理一批數據,直到運算完成為止,然後才能進行另外一批數據的處理,中間不能被打斷,原因是此時的外存如磁帶、卡片等只能順序輸入。
人工管理階段的數據具有以下的幾個特點。
(1)數據不保存。由於當時計算機主要用於科學計算,數據保存上並不做特別要求,只是在計算某一個課題時將數據輸入,用完就退出,對數據不作保存,有時對系統軟體也是這樣。
(2)數據不具有獨立。數據是作為輸入程序的組成部分,即程序和數據是一個不可分隔的整體,數據和程序同時提供給計算機運算使用。對數據進行管理,就像現在的操作系統可以以目錄、文件的形式管理數據。程序員不僅要知道數據的邏輯結構,也要規定數據的物理結構,程序員對存儲結構,存取方法及輸入輸出的格式有絕對的控制權,要修改數據必須修改程序。要對100組數據進行同樣的運算,就要給計算機輸入100個獨立的程序,因為數據無法獨立存在。
(3)數據不共享。數據是面向應用的,一組數據對應一個程序。不同應用的數據之間是相互獨立、彼此無關的,即使兩個不同應用涉及到相同的數據,也必須各自定義,無法相互利用,互相參照。數據不但高度冗餘,而且不能共享。
(4)由應用程序管理數據:數據沒有專門的軟體進行管理,需要應用程序自己進行管理,應用程序中要規定數據的邏輯結構和設計物理結構(包括存儲結構、存取方法、輸入\輸出方式等)。因此程序員負擔很重。
綜上所說,所以有人也稱這一數據管理階段為無管理階段。
2. 文件系統階段:
20世紀50年代後期到60年代中期,數據管理發展到文件系統階段。此時的計算機不僅用於科學計算,還大量用於管理。外存儲器有了磁碟等直接存取的存儲設備。在軟體方面,操作系統中已有了專門的管理數據軟體,稱為文件系統。從處理方式上講,不僅有了文件批處理,而且能夠聯機實時處理,聯機實時處理是指在需要的時候隨時從存儲設備中查詢、修改或更新,因為操作系統的文件管理功能提供了這種可能。這一時期的特點是:
(1)數據長期保留。數據可以長期保留在外存上反復處理,即可以經常有查詢、修改和刪除等操作。所以計算機大量用於數據處理。
(2)數據的獨立性。由於有了操作系統,利用文件系統進行專門的數據管理,使得程序員可以集中精力在演算法設計上,而不必過多地考慮細節。比如要保存數據時,只需給出保存指令,而不必所有的程序員都還要精心設計一套程序,控制計算機物理地實現保存數據。在讀取數據時,只要給出文件名,而不必知道文件的具體的存放地址。文件的邏輯結構和物理存儲結構由系統進行轉換,程序與數據有了一定的獨立性。數據的改變不一定要引起程序的改變。保存的文件中有100條記錄,使用某一個查詢程序。當文件中有1000條記錄時,仍然使用保留的這一個查詢程序。
(3)可以實時處理。由於有了直接存取設備,也有了索引文件、鏈接存取文件、直接存取文件等,所以既可以採用順序批處理,也可以採用實時處理方式。數據的存取以記錄為基本單位。
上述各點都比第一階段有了很大的改進。但這種方法仍有很多缺點,主要是:
(1)數據共享性差,冗餘度大。當不同的應用程序所需的數據有部分相同時,仍需建立各自的獨立數據文件,而不能共享相同的數據。因此,數據冗餘大,空間浪費嚴重。並且相同的數據重復存放,各自管理,當相同部分的數據需要修改時比較麻煩,稍有不慎,就造成數據的不一致。比如,學籍管理需要建立包括學生的姓名、班級、學號等數據的文件。這種邏輯結構和學生成績管理所需的數據結構是不同的。在學生成績管理系統中,進行學生成績排列和統計,程序需要建立自己的文件,除了特有的語文成績、數學成績、平均成績等數據外,還要有姓名、班級等與學籍管理系統的數據文件相同的數據。數據冗餘是顯而易見的,此外當有學生轉學走或轉來時,兩個文件都要修改。否則,就會出現有某個學生的成績,卻沒有該學生的學籍的情況,反之亦然。如果系統龐大,則會牽一發而動全身,一個微小的變動引起一連串的變動,利用計算機管理的規模越大,問題就越多。常常發生實際情況是這樣,而從計算機中得到的信息卻是另一回事的事件。
(2)數據和程序缺乏足夠的獨立性。文件中的數據是面向特定的應用的,文件之間是孤立的。不能反映現實世界事物之間的內在聯系。在上面的學籍文件與成績文件之間沒有任何的聯系,計算機無法知道兩個文件中的哪兩條記錄是針對同一個人的。要對系統進行功能的改變是很困難的。如在上面的例於中,要將學籍管理和成績管理從兩個應用合並成一個應用中,則需要修改原來的某一個數據文件的結構,增加新的欄位,還需要修改程序,後果就是浪費時間和重復工作。此外,應用程序所用的高級語言的改變,也將影響到文件的數據結構。比如BASIC語言生成的文件,COBOL語言就無法如同是自己的語言生成的文件一樣順利地使用。總之數據和程序之間缺乏足夠的獨立性是文件系統的一個大問題。
文件管理系統在數據量相當龐大的情況下,已經不能滿足需要。美國在60年代進行阿波羅計劃的研究。阿波羅飛船由約200萬個零部件組成。分散在世界各地製造。為了掌握計劃進度及協調工程進展,阿波羅計劃的主要合約者羅克威爾(Rockwell)公司曾研製了一個計算機零件管理系統。系統共用了18盤磁帶,雖然可以工作,但效率極低,維護困難。18盤磁帶中60%是冗餘數據。這個系統一度成為實現阿波羅計劃的嚴重障礙。應用的需要推動了技術的發展。文件管理系統面對大量數據時的困境促使人們去研究新的數據管理技術,資料庫技術應運而生了!例如,最早的資料庫管理系統之一IMS就是上述的羅克威爾公司在實現阿波羅計劃中與IBM公司合作開發的,從而保證了阿波羅飛船1969年順利登月。
3.資料庫系統階段
從20世紀60年代後期開始,數據管理進入資料庫系統階段。這一時期用計算機管理的規模日益龐大,應用越來越廣泛,數據量急劇增長,數據要求共享的呼聲越來越強。這種共享的含義是多種應用、多種語言互相覆蓋地共享數據集合。此時的計算機有了大容量磁碟,計算能力也非常強。硬體價格下降,編制軟體和維護軟體的費用相對在增加。聯機實時處理的要求更多,並開始提出和考慮並行處理。
在這樣的背景下,數據管理技術進入資料庫系統階段。
現實世界是復雜的,反映現實世界的各類數據之間必然存在錯綜復雜的聯系。為反映這種復雜的數據結構,讓數據資源能為多種應用需要服務,並為多個用戶所共享,同時為讓用戶能更方便地使用這些數據資源,在計算機科學中,逐漸形成了資料庫技術這一獨立分支。計算機中的數據及數據的管理統一由資料庫系統來完成。
資料庫系統的目標是解決數據冗餘問題,實現數據獨立性,實現數據共享並解決由於數據共享而帶來的數據完整性、安全性及並發控制等一系列問題。為實現這一目標,資料庫的運行必須有一個軟體系統來控制,這個系統軟體稱為資料庫管理系統(Database Management System,DBMS)。資料庫管理系統將程序員進一步解脫出來,就像當初操作系統將程序員從直接控制物理讀寫中解脫出來一樣。程序員此時不需要再考慮數據中的數據是不是因為改動而造成不一致,也不用擔心由於應用功能的擴充,而導致程序重寫,數據結構重新變動。在這一階段,數據管理具有下面的優點:
(1)數據結構化:數據結構化石資料庫系統與文件系統的根本區別。在文件系統中,相互獨立的文件的記錄內部是有結構的,傳統文件的最簡單形式是等長同格式的記錄集合。這樣就可以節省許多儲存空間.
數據的結構化是資料庫主要特徵之一。這是資料庫與文件系統的根本區別。至於這種結構化是如何實現的,則與資料庫系統採用的數據模型有關,後面會有較詳細的描述。
(2)數據共享性高,冗餘度小,易擴充。資料庫從整體的觀點來看待和描述數據,數據不再是面向某一應用,而是面向整個系統。這樣就減小了數據的冗餘,節約存儲空間,縮短存取時間,避免數據之間的不相容和不一致。對資料庫的應用可以很靈活,面向不同的應用,存取相應的資料庫的子集。當應用需求改變或增加時,只要重新選擇數據子集或者加上一部分數據,便可以滿足更多更新的要求,也就是保證了系統的易擴充性。
(3)數據獨立性高。資料庫提供數據的存儲結構與邏輯結構之間的映像或轉換功能,使得當數據的物理存儲結構改變時,數據的邏輯結構可以不變,從而程序也不用改變。這就是數據與程序的物理獨立性。也就是說,程序面向邏輯數據結構,不去考慮物理的數據存放形式。資料庫可以保證數據的物理改變不引起邏輯結構的改變。
資料庫還提供了數據的總體邏輯結構與某類應用所涉及的局部邏輯結構之間的映像或轉換功能。當總體的邏輯結構改變時,局部邏輯結構可以通過這種映像的轉換保持不變,從而程序也不用改變。這就是數據與程序的邏輯獨立性。舉例來講,在進行學生成績管理時,姓名等數據來自於數據的學籍部分,成績來自於數據的成績部分,經過映像組成局部的學生成績,由資料庫維持這種映像。當總體的邏輯結構改變時,比如學籍和成績數據的結構發生了變化,資料庫為這種改變建立一種新的映像,就可以保證局部數據——學生數據的邏輯結構不變,程序是面向這個局部數據的,所以程序就無需改變。
(4)統一的數據管理和控制功能,包括數據的安全性控制、數據的完整性控制及並發控制、資料庫恢復。
資料庫是多用戶共享的數據資源。對資料庫的使用經常是並發的。為保證數據的安全可靠和正確有效,資料庫管理系統必須提供一定的功能來保證。
資料庫的安全性是指防治非法用戶的非法使用資料庫而提供的保護。比如,不是學校的成員不允許使用學生管理系統,學生允許讀取成績但不允許修改成績等。
數據的完整性是指數據的正確性和兼容性。資料庫管理系統必須保證資料庫的數據滿足規定的約束條件,常見的有對數據值的約束條件。比如在建立上面的例子中的資料庫時,資料庫管理系統必須保證輸入的成績值大於0,否則,系統發出警告。
數據的並發控制是多用戶共享資料庫必須解決的問題。要說明並發操作對數據的影響,必須首先明確,資料庫是保存在外存中的數據資源,而用戶對資料庫的操作是先讀入內存操作,修改數據時,是在內存在修改讀入的數據復本,然後再將這個復本寫回到儲存的資料庫中,實現物理的改變。
由於資料庫的這些特點,它的出現使信息系統的研製從圍繞加工數據的程序為中心轉變到圍繞共享的資料庫來進行。便於數據的集中管理,也提高了程序設計和維護的效率。提高了數據的利用率和可靠性。當今的大型信息管理系統均是以資料庫為核心的。資料庫系統是計算機應用中的一個重要陣地。
產品數據管理(PDM)是以軟體為基礎,管理與產品相關的信息(包括電子文檔、數字化文件、資料庫記錄等)和所有與產品相關的過程(包括審批/發放過程、工程更改過程、一般工作流程等)的技術。它提供產品全生命周期(包括市場需求調研、產品開發、產品設計、銷售、售後服務)的信息管理,並可在企業范圍內為產品設計和製造建立一個並行化的協作環境。
PDM技術最早出現於八十年代初期,目的是為了解決大量工程圖紙、技術文檔以及CAD文件的計算機化的管理問題,後來逐漸擴展到產品開發中的三個主要領域:設計圖紙和電子文檔的管理、材料報表(BOM)的管理以及與工程文檔的集成、工程變更請求/指令的跟蹤與管理。現在所指的PDM技術源於美國的叫法,是對工程數據管理(EDM)、文檔管理(DM)、產品信息管理(PIM )、技術數據管理(TDM)、技術信息管理(TIM)、圖像管理(IM)及其它產品信息管理技術的一種概括與總稱。
PDM技術在全球的應用領域十分廣泛,包括機械、電子、汽車、航空、航天以及非製造業等。目前,汽車工業已經在全球范圍內開始實施PDM技術(如福特、通用等),航空/航天工業用PDM技術對企業進行重組(如波音、麥道等),非製造業(如交通、商業、電子出版等)應用PDM技術的增長速度也十分迅速。 PDM系統在文檔管理、變更控制、配置管理與信息跟蹤等方面也得到廣泛的應用,並把它作為支持企業重組(如技術重組、產品重組、信息重組等)、並行工程、虛擬製造等的使能技術。
隨著網路技術、資料庫技術和O—O技術的發展,PDM技術得到了廣泛的應用。PDM技術是目前世界上非常熱門、且飛速發展的技術,據美國一家公司預測,今後五年內,每年將以30%的年增長率發展,帶來的效益也相當可觀。通過減少用戶的信息查詢時間、設計變更的通告時間以及設計人員之間方便的協作環境,可使新產品開發周期縮短30%以上。

一、PDM系統的主要功能

PDM系統為企業提供了一種宏觀管理和控制所有與產品相關的信息的機制和構架,其主要功能包括:

1.電子倉庫
它是PDM中最基本、最核心的功能,它保存了管理數據的數據(元數據)以及指向描述產品的相關信息的物理數據和文件的指針,它為用戶存取數據提供一種安全的控制機制,並允許用戶透明地訪問全企業的產品信息,而不用考慮用戶或數據的物理位置。

2.工作流或過程管理
用來定義和控制數據操作的基本過程,它主要管理當用戶對數據進行操作時會發生什麼,人與人之間的數據流向以及在一個項目的生命周期內跟蹤所有事務和數據的活動。它是支持工程更改必不可少的工具。

3.產品結構與配置管理
以電子倉庫為底層支持,以材料報表為其組織核心,把定義最終產品的所有工程數據和文檔聯系起來,實現產品數據的組織、控制和管理,並在一定目標或規則約束下向用戶或應用系統提供產品結構的不同視圖和描述。

4.查看和圈閱
為計算機化審批過程提供支持,用戶利用該功能可以察看電子倉庫中存儲的數據內容(特別是圖象或圖形數據),如果需要,用戶還可以利用圖形覆蓋技術對文件進行圈點和注釋。

5.掃描與成像
把圖紙或縮微膠片掃描轉換成數字化圖像,並把它置於PDM系統控制管理之下,為企業原有非數字化圖紙與文檔的計算機管理提供支持。

6.設計檢索和零件庫
對已有設計信息進行分類管理,以便最大程度地重新利用現有設計成果,為開發新產品服務。

7.項目管理
項目管理在PDM系統中考慮的較少,許多PDM系統只能提供工作流活動的信息。一個功能很強的項目管理器能夠為管理者提供每分鍾項目和活動的狀態信息。

8.電子協作
主要實現人與PDM系統中數據之間高速、實時地交互功能,包括設計審查時的在線操作、電子會議等。

9.工具與「集成件」
為了使不同應用系統之間能夠共享信息以及對應用系統所產生的數據進行統一管理,要求把外部應用系統「封裝」和集成到PDM系統中,並提供應用系統與資料庫以及應用系統與應用系統之間的信息集成。

二、PDM技術的發展趨勢

1.網路技術在PDM系統中的應用越來越深入
基於網路平台和Java語言開發的結構靈活、用戶界面友好的PDM系統已成為一種趨勢。在PDM系統中通過Web實現全球化的信息查詢、瀏覽、創建與更新已逐漸成為現實,並以此來支持全球化的虛擬企業的信息管理。

2.面向對象技術的應用及信息模型的標准化
由於PDM系統所要管理的數據類型及數據模型的復雜性,要求系統有良好的開放性,採用O一O方法建立系統管理模型與信息模型,並提供面向對象的建模工具與開發工具,支持用戶的二次開發。另一方面,由於各系統功能不一樣,其信息模型也不一樣,即使是相同的功能,不同系統信息模型差別也很大,如何實現PDM系統信息模型的標准化,為不同系統之間提供信息交換帶來方便成為當務之急。

3.PDM與MRP的功能滲透
一方面,PDM與MRP分別服務於工程設計與生產製造。PDM系統源於CAD/CAM應用與工程設計的需要,所以它管理的重點為工程信息。而MRP系統源於製造業的經營與生產活動的管理,包括經營、生產、物料需求的計劃與製造資源的需求計劃的管理。兩者的橋梁紐帶為BOM表。目前,二者之間通過相互集成,互為補充,構成完整的企業信息系統。另一方面,二者之間又互相滲。PDM廠商首先將工程BOM與製造BOM統一PDM系統中進行管理,同時將經營計劃、生產計劃集成於PDM系統中,而MRP系統也在設法PDM系統的功能歸人其中。

4.過程管理與配置管理功能的強化
為了適應產品設計與製造過程中復雜過程變的需要,各廠商競相開發出獨立的工作流程管理塊,且功能不斷變強,以滿足工程更改、並行化產設計所必需的過程管理的需要。以配置管理為核心,將數據管理、工作流程管理與變更控制集於一體,形成更為強大的PDM系統。

『叄』 提供WWW服務的JAFOV資料庫

K.Yamamoto

(Koka Women's College,38 Kadonocho,Nishikyogoku,Ukyo,Kyoto 571,Japan)

N.Nishiwaki

(Nara University,1500 Misasagicho,Nara 631,Japan)

摘要JAFOV是一個描述日本脊椎動物化石標本的資料庫,存儲了大約4500個標本的有關數據。資料庫於1982年建立在日本Kyoto大學數據處理中心的大型機上,並以聯機形式提供對外服務。這個系統使用不方便且圖像處理功能弱,因此我們試圖運用WWW技術來解決這些問題。WWW提供非常美觀、友好的用戶界面,是一條在網際網路上處理各種多媒體信息的有效途徑。在本項研究中,我們使用WWW技術開發了一個基於網際網路的新型JAFOV服務系統原型。經過試運行,我們認為建立的新系統對JAFOV這類資料庫的改造是適合的。

關鍵詞資料庫化石脊椎動物標本網際網路WWWDBMS

1引言

JAFOV是日本脊椎動物化石標本資料庫。它於1982年建成,記錄了大約4500個標本的描述數據。資料庫存放在日本Kyoto大學數據處理中心的大型機上,以聯機資料庫的形式提供對外服務。然而,資料庫還存在一些問題,如不易使用、圖像(標本的照片念叢或草圖)聯機處理功能弱等。

在本項研究中,我們試著應用WWW技術使系統的使用更加容易並增強圖像的聯機處理能力。WWW提供非常美觀、友好的用戶界面,是一條在網際網路上處理各種多媒體信息的有效途徑。將它與DBMS連接,我們可以獲得一個比當前使用的JAFOV聯機資料庫更好的服務系統。

在本項研究中,對要開發的目標系統有以下幾點要求:

(1)數據檢索可以通過WWW瀏覽器仔早櫻如Mosaic,Netscape等進行;

(2)能處理的數據不僅包括文檔和數字,還應包括化石的圖像;

(3)檢索到的數據能直接在終端上顯示、列印或下載到用睜燃戶計算機上。

2JAFOV簡介

2.1資料庫內容

名字JAFOV來源於jApanese FOssil Vertebrate(日本脊椎動物化石)的縮寫。它是一個由日本脊椎動物化石標本描述的數據組成的資料庫。JAFOV資料庫的內容包括化石標本的文檔、數字和圖像數據,見圖1。不過到目前為止,只有文檔數據已經入庫,而由於某些原因(主要是技術上的),資料庫還遠沒有實現。

圖1JAFOV資料庫的原始設計

JAFOV使用一個稱為FAIRS的DBMS層次模型。它專為富士通公司製造的大型計算機而設計。這個DBMS適合於文檔資料庫,如正在使用的JAFOV,它為那些作為查找關鍵詞而經常使用的數據項生成一個倒排文件以加速查找過程。這個模型不適合於處理數字和圖像數據。

JAFOV由41個數據項(表1)組成,內容包括標本的描述、地理位置、地質層位、保管人及其它有關信息等。它們被歸類為8個組,即:名字、類屬、產地、化石形成層位、地質年齡、化石區段、標本保管人和相關參考書目。其中一部分數據項被定義為查找鍵,其餘除少量僅供輸出外,均作為文本數據項進行查找。

表1JAFOV資料庫中的數據項

大部分數據項的值直接從原始數據輸入,其餘則通過使用字典和/或轉換表從其它數據項獲取值。如轉換表中箭頭所示,有一些數據項的值通過已有的轉換表生成,還有一些則從父數據項中摘取生成。這些數據項的存在減少了數據輸入工作量並大大降低了數據出錯率。

2.2資料庫結構

JAFOV資料庫由JAFOV工作組建立和維護,它是日本脊椎動物化石學家協會(AVPJ)下的一個志願小組。

建立JAFOV資料庫的過程如圖2所示。原始數據由日本的古生物研究所(所)及博物館的志願者提供。他們填寫有關他們標本的數據採集單並交給工作組。工作組檢查數據單並把內容輸入到計算機形成原始計算機數據,由計算機的數據轉換程序自動把它轉換成JAFOV需要的輸入數據。在這個過程中,一些數據項的數據通過參照從代碼表得到的字典文件被生成,另一些項的數據則從父數據項中摘取。隨後以JAFOV的格式列印出數據列表,並送回給數據提供者作校驗。如果需要,原始計算機數據還將根據數據提供者的規范要求進行校正。此後,JAFOV的輸入數據准備完畢,DBMS根據其數據定義將輸入數據送到JAFOV。到這個時候,資料庫中建立了兩個文件:數據文件和它的倒排文件。

圖2建立JAFOV資料庫的過程

2.3當前提供服務的方式

目前,JAFOV作為聯機資料庫已經運行於Kyoto大學數據處理中心的大型機上,提供服務的主要方式見圖3。可以通過直接或間接(即通過其它計算中心)聯接到中心的一台終端來使用資料庫。幾年前網際網路尚未建成,對資料庫的存取只能通過連接在大學計算機互聯網路(NACSIS)上的計算中心進行,而且還要對用戶進行驗證和收費。

圖3當前JAFOV提供服務的方式

圖4顯示的是目前JAFOV的使用方法。用戶使用telnet將終端直接或通過前面提及的其它計算中心間接地連接到Kyoto大學數據處理中心的主計算機上,以telnet方式登錄計算機,然後使用圖中所示命令互動式地查詢他需要的數據。

3WWW版本的JAFOV

3.1需要改進的地方及解決方法

現行的JAFOV系統有許多有待改進的問題,尤其是其服務方式。系統的使用應該更加容易、更加廣泛,並且還應提供除文檔處理以外的數據處理能力。存在的主要問題包括:

(1)不友好的用戶界面:現在的用戶界面是命令行方式(如圖4),對研究人員很不方便;

圖4當前JAFOV的使用方式

(2)服務受限制:使用JAFOV之前需要注冊到NACSIS的某一計算中心,也就是說只有注冊的用戶才能使用資料庫;

(3)建立和維護多媒體資料庫困難;

(4)在大型機上建立和維護JAFOV成本太高。

而WWW技術為這些問題提供了很好的解決方案:

(1)可以使用WWW瀏覽器漂亮、友好的圖形用戶界面;

(2)通過網際網路進行二進制數據變換很方便;

(3)提供很好的圖像文件顯示;

(4)通過網際網路可以實現更廣范圍的存取。

為此,我們試著開發了JAFOV的一個WWW版本,其規范要求和功能在下文描述。

圖5JAFOV的WWW服務簡圖

3.2JAFOV的WWW服務概貌

JAFOV的WWW服務框架見圖5。當用戶使用WWW瀏覽器通過網際網路訪問到伺服器時,JAFOV的首頁(圖6)顯示在其計算機上。用戶在該頁上輸入搜索條件並提交頁面,然後與條件匹配的記錄/標本被檢索出來,並將其登記號以可點擊按鈕(圖7)的形式顯示在客戶計算機上。用滑鼠單擊任一登記號,可以顯示該記錄的內容,見圖8。

圖6JAFOV的WWW服務首頁

圖7查詢JAFOV得到的結果記錄列表

圖8記錄的內容

上例顯示的查找過程與圖4所示例子相同。毫無疑問,這里顯示的方法比當前正在使用的方法對用戶要友好得多。

3.3WWW版JAFOV的DBMS

在本項研究中,我們開發了一個原始DBMS,並以此建立了WWW版JAFOV的一個原始資料庫。WWW版JAFOV的結構見圖9,它由兩類文件組成,即主文件和附加文件。主文件包含文檔數據和圖像數據文件名。篇幅長的文檔數據如參考文獻也可以文件形式單獨存儲,而在主文件中只存儲相應的文件名。雖然這類數據不能被檢索,但可以使查詢時間更短。圖像數據是作為附加文件存儲的。

圖9WWW版JAFOV資料庫的結構

主文件是一個文本型簡單文件,其中定義了數據項/域。它由「項/域定義記錄」和「標本數據記錄」組成。項/域定義記錄以CSV(即以逗號分隔的變數)的形式置於文件的第一個記錄。接下去是與項/域定義記錄有相同格式和順序的標本數據記錄。一個標本使用一個記錄。文件可以由任意一種文本編輯器生成。

在檢索生成的頁面中,圖像和文本文件以超文本形式連接起來。頁面中嵌入了一個標志,它連接到圖像或文本文件。當點取該標志時可以顯示與之連接的圖像或長文本數據。標志在頁面上以可點取的按鈕形式顯示。

3.4系統的查找過程

一般說來,WWW服務中的數據檢索通過公共網關介面(CGI)來處理,如圖10。通過使用HTML的表功能生成的頁面顯示在客戶計算機的WWW瀏覽器上。當用戶在頁面中輸入搜索條件並按「發送」按鈕後,條件通過CGI介面送到DBMS,數據搜索開始。檢索到的數據以HTML文件的格式送回客戶端並顯示在客戶計算機上。

圖10通過WWW進行信息檢索的通用機制

圖11顯示的是我們開發的系統中資料庫檢索及結果顯示的機理。系統基本上使用CGI介面。首先,用戶輸入的條件通過CGI送到數據檢索模塊。模塊在數據主文件中查找數據,並生成一個臨時文件和一個HTML文件,檢索到的記錄在HTML文件中以可點取按鈕(圖7)的形式列出來。檢索中可以使用多個查找條件,但條件之間只能是「與」的關系。

然後伺服器把模塊生成的HTML文件送回客戶端。用戶可以用滑鼠單擊記錄以顯示查到的詳細資料。當單擊任一標本登記號時,信息也是通過CGI送到顯示模塊。模塊使用選定的文件生成HTML格式的顯示頁面,並將它送回客戶端。於是,與記錄有關的圖像就通過相應的文件名連接到頁面上。

圖6~8是執行檢索的一個例子。圖6是用戶輸入查詢條件的頁面,即首頁。圖7是輸入條件為「『名字』中包含『NAUMANNI』」時獲得的查詢結果。查詢得到了兩個標本並顯示為圖中可點取的按鈕。這一頁通過圖11中的數據查詢模塊生成。同時,檢索到的數據其全部內容保存在圖11中的選定數據文件中。圖8是單擊圖7中按鈕後顯示的記錄內容。這一頁通過圖11中的顯示模塊生成,它從選定文件中檢索出數據並使用一個模板來生成本頁。

4結論

在本項研究中,我們通過使用WWW技術開發了一個基於網際網路的原型系統,很好地改進了JAFOV資料庫和其提供服務的方式。改進的方麵包括:

(1)顯著改善了用戶界面,用戶對系統的使用更加方便;

(2)使用資料庫的范圍變得更為廣泛,因為WWW服務不需要預先注冊,所有能連接到網際網路上的客戶都能使用;

(3)資料庫可以像處理文本數據那樣方便地處理圖像數據。

這些改進很好地解決了JAFOV當前版本中存在的大部分問題。

然而,要使這個系統在網際網路上實際運行,還有一些問題需要解決,這些問題主要包括:

(1)查詢數據需要的時間偏長;

數學地質和地質信息

(2)本項研究中開發的DBMS可以達到的實際容量是1000個記錄,當存儲記錄數超過該數目時,數據查詢將花費更長的時間。

通過使用功能更強大的DBMS如RDBMS作為搜索引擎,這些問題可以得到解決。因此,我們正在使用RDBMS來開發實用型系統。

致謝筆者衷心感謝Toyo信息系統有限公司的Shintaro Inoue先生,他參與了本系統的開發,還要感謝CSK有限公司的Koushiro Miyauchi先生,他對本項研究中使用的計算機作了軟硬體配置與調試。(龔仁輝譯,陳建平校)

參考文獻

[1]T.Kamei,K.Yamamoto,and N.Nishiwaki.Database on Fossil Vertebrate Specimens Deposited in Japan:JAFOV.Bull.Data Proc.Cent.,Kyoto Univ.,1986,19(4):260~268(in Japanese).

[2]N.Nishiwaki.Database on Fossil Specimens Deposited in Japan.Proc.3rd Intern.Conf.Geosci.Inf.orm.(Adelaide,Australia).Australian Mineral Foundation,1986,1:62~70.

[3]N.Nishiwaki,K.Yamamoto,and T.Kamei.Data Base on the Japanese Fossil Vertebrates.P.S.Glaeser(Ed.)Data for Science and Technology.Proc.8th Intern.CODATA Conf.(Jachranka,Poland),North-Holland Pub.Co.,1982,75~80.

[4]K.Yamamoto,N.Nishiwaki,and T.Kamei.JAFOV:Data Base on the Japanese Fossil Vertebrates(1).Geol.Data Proe.,1982,7:21~30(in Japanese).

[5]K.Yamamoto,N.Nishiwaki,and T.Kamei.Present Status and Future Extension of JAFOV:Database on the Japanese Fossil Vertebrates.Geol.Data Proc.,1987,12:142~150(in Japanese).

[6]K.Yamamoto,N.Nishiwaki,and Y.Kawamura.An Extension of the Japanese Fossil Vertebrates Database JAFOV.Bull.Data Proc.Center,Kyoto Univ.,1994,27(3):117~120(in Japanese).

[7]H.Horiike,Y.Ozawa,Y.Murao,and T.Watanabe.User's Manual:Database Retrieval with FAIRS.Data Proc.Cent.,Kyoto Univ,1984(in Japanese).

[8]L.Aranson.HTML Manual of Style.Ziff-Davis Press,Emeryville,California,1994.

『肆』 中國數字植物標本館的資料庫

1.標本信息
提供成員單位標本館所完成的數字化標本信息,包括一般標本及模式標本。每份標本信息包括標簽信息及圖像信息,前者包括標本採集人、採集日期、地點、生境與海拔以及鑒定信息和標本存放地點(標本館)等。
目前在CVH網上能查詢到中科院系統13家標本館標本,共計二百八十五萬份(筆)標本信息及一百五十五萬張標本圖像,缺乏圖像的記錄已在首頁予以標明。
網上模式標本6500份,僅包括中科院植物所標本館館藏的模式標本,包括裸子植物、毛茛科、蕁麻科、山茶科、殼斗科等類群。信息均經過核實,還附有發表新種的原始文獻(PDF格式)以及高解析度標本圖像。
分布式標本信息檢索系統:目前CVH的標本信息是通過集中式實現共享查詢的,其主要缺陷是更新周期長,存儲壓力大。我們正在試驗的分布式標本信息查詢系統已有5家標本館(稱CVH分館)參與,共有100多萬份標本信息實現實時更新,並由成員單位通過FTP自主管理其分館,有效地發揮成員單位的積極性。
2.《中國植物志》資料庫
包括全套《中國植物志》79卷(除第一卷外)125冊圖書的PDF文件,可通過科名和植物名稱(學名、中名)查詢到志書文字及圖版。最近完成的檢索文件復核補充工作使資料庫更全面准確地反映植物志的內容,除正名(accepted name)外,討論部分的學名也可查到。資料庫記錄數:45000餘條。
3.彩色圖庫
上傳到CVH網站上的植物彩色照片共計五萬余張,屬於269科5700種,為近年來眾多志願者自野外拍攝所得,范圍涉及在全國34個省(區、市)的野生植物。下階段將逐步建立彩圖鑒定專家系統,以提高照片鑒定準確性。
至此,用戶輸入學名或中名可關聯性查詢到標本、植物志及彩色圖片三大資料庫,這也是CVH的主要資料庫。
4.其他相關資料庫
為方便用戶使用標本信息,「中國數字植物標本館」網站還提供其他大量相關的(植物學)資料庫,如標本採集地名與標本館數據、分類研究人員及其研究論文題錄等。這些資料庫或源自實際工作經驗的總結、或直接轉自權威工具書並經過專家審核。
1)《中國高等植物圖鑒》資料庫
為該書全套五冊正編及兩冊補編共7本書的全文檢索。可通過科名和植物名稱(學名及中名)查詢到書中正文文字及圖畫。資料庫記錄數:9057條。
2)地方植物志及其統一查詢
提供12套地方誌的數字化文擋(PDF文件),可通過統一關聯查詢任何1-12種植物志信息,包括西藏、秦嶺、遼寧、貴州、浙江、海南等省(區/市)及地區植物志。下階段計劃實現《中國植物志》與地方植物志的關聯查詢。資料庫記錄數:47112條。
3) 「三種主要志書屬名資料庫」
提供查詢中國維管植物屬名在《中國植物志》、《中國高等植物圖鑒》和FLORA OF CHINA中的位子,包括卷冊及頁碼。這三套志書(圖鑒)是目前研究中國植物的主要參考書。該資料庫的復核工作已於最近完成,增加了新近出版 FLORA OF CHINA卷冊內容,並修改(修訂)數百條記錄,使數據更准確全面。資料庫記錄數:3504條。
4)植物名稱及分布資料庫
通過該庫可以快速查詢到中國種子植物名稱及分布信息(到省級)等簡單信息。資料主要來源於《中國植物志》和 已出版的Flora of China,可以認為是《中國植物志》的名錄修訂。目前資料庫記錄數:34056條。
5)模式標本名錄及其原始文獻資料庫
該資料庫以收集中國原生植物(Native plant)名稱模式標本及其發表原始文獻資料為宗旨,無論其模式標本採集地及保藏地在國內或國外、該名稱何時於何種刊物發表都盡量予以收錄。每條記錄包括植物名稱(學名、中名)、發表刊物,模式標本採集地點和生境、年代及標本採集人和採集號,以及標本存放地點(標本館)。大部分資料以外文形式出現。資料庫資料來源於國內外多種書刊,其中標本館代碼依 Holmgren et al.1990. Index Herbariorum和傅立國等1993《中國植物標本館索引》(中國科技出版社)。縮寫代號HT: Holotype, IT: Isotype, T: Type。目前資料庫記錄數:30705條
6)植物名稱作者(命名人)資料庫
據統計,至今為止,中國植物命名作者多達五千餘人,其中命名兩個及兩個以上名稱的有近3500人。本資料庫就是基於這3500人的資料建立的,每條記錄包括作者全名及標准縮寫、工作/出生/生卒年代、專長類群等。中國作者(共919條目)還附有中文名及工作單位。本資料庫依據國內外多種書刊資料編輯而成,其中人名拼寫標准主要依據Brummitt & Powell 1992, Authors of Plant Names。類群代碼為:A:藻類;B:苔蘚;C:孢子植物;F:化石植物;M:真菌和地衣;P:蕨類;S:種子植物。目前資料庫記錄數:3481條。
7)中國植物分類學文獻要覽(1949-1990)
一般地,查詢20世紀50年代以前中國植物學文獻時可查詢E.D.Merrill & E.H.Walker 《東亞植物學文獻目錄》(1938)及其補編(1960),90年代以後資料的查詢則多利用各種網路資源。本資料庫填補了50年代至90年代之間的空白,它主要涵蓋中國大陸學者1949-1990年間發表的植物系統學文獻,內容包括作者姓名、論著題目及發表書刊等。本庫資料主要來源於《中國植物系統學文獻要覽》(陳心啟等1993,廣東科技出版社)。目前資料庫記錄數:6879條
8)標本採集地新舊地名對照資料庫
在我國,二十世紀初以前標本採集地的名稱,現今常有改變而不再使用。在這種情形下,很有必要通過對舊時和現在地圖的核對及參考相關採集資料,來製作新舊地名對照表,建立新舊地名資料庫,包括舊地名的經緯度數據,以供標本查詢及分類學研究之用。我們根據中國植物分類學家研究經驗,總結出包括11個省(市)2000多條採集地新舊地名對照記錄。每個舊地名盡可能包括其舊外文名、位置(經緯度),並標明該地名在現今縣級行政區的名稱、國家標准代碼和經緯度。目前資料庫記錄數:2048條
9)中國植物標本館資料庫
本資料庫信息基本於《中國植物標本館索引》(傅立國等,1993)一書,共收錄全國300餘家標本館,並於最近對其中幾十家主要標本館信息進行了更新。每家標本館信息包括標本館名稱和地址、聯系人及聯系方法,館藏特色及收藏目標,以及主要研究人員信息等。
5.植物鑒定指南性資料
本部分資料庫包括互動式檢索表(又稱電子檢索表)和植物形態術語圖說等,目的是為用戶提供從植物特徵識別和標本鑒定,到上述的標本及圖像比對,一直到物種形態特徵描述和國內分布等一站式服務。
1)電子檢索表
這是一種互動的計算機程序,使用者不斷地向這個程序里輸入標本或活植物的性狀,那些不具有這些性狀的分類群將被排除掉,直到只剩下一個分類單元。它是系統植物學、生物編目與保護的一種非常好的鑒定工具。本檢索表提供檢索中國種子植物270餘個科的電子路徑。
2)科屬詞典資料庫
該庫轉接自成員單位網站,其信息來自侯寬昭主編、吳德鄰等人修訂的《中國種子植物科屬詞典》(第二版),共收集我國種子植物276科,3109屬,重點描述我國種子植物的科、屬形態、地理分布、屬種統計、主要經濟用途等。該書是我國植物學專業書籍銷量最大的圖書。其電子詞典製作的目的是為了方便用戶對植物多樣性學信息的獲取。
3)「植物鑒定和描述形態術語圖解」資料庫
包括種子植物形態術語1133條,涵蓋了植物鑒定和描述所使用的絕大部分術語,涉及根、莖、葉、花、花序、果實等植物器官。每個條目包括中、英文術語及其中英文釋義四部分內容。選詞標准規范,釋義准確、簡明扼要,大部分術語還配有一至多幅精美的線描圖(共1297幅),圖畫特徵明顯,對於讀者理解術語的含義大有裨益。本庫資料主要來源於Harris & Harris 1994, Plant Identification Terminology :An Illustrated Glossary (王宇飛等人譯,2001. 科學出版社)一書。
4)「國家重點保護野生植物名錄(第一、二批)」資料庫
第一批名錄已於一九九九年發布執行,第二批名錄經數年討論仍未正式發布,但已基本擬定,故一並列出,供用戶參考。兩個名錄共計約1900種(其中蘭科植物約佔2/3)。該庫可查詢到植物名稱(中名、學名)、科名、批次及保護等級、國內分布(到省級)、海拔高度等信息。
6.科普及孢子植物欄目(分館)
1)苔蘚植物分館和蕨類植物分館
兩者均分列中國植物名錄、植物志、名詞解釋、植物照片、專家介紹及學科通訊等相關資料,利於專門用戶查訪。
2)科普分館
主要是基於植物物種多樣性開發的科學普及常識。其中 「標本館常規技術」和「常用葯用植物」兩個欄目是我們特地為「中國數字植物標本館」所編寫的。前者包括「標本採集和壓制」、「標本裝訂」、「用檢索表鑒定植物」和「植物名稱知識介紹」等標本館常用的專業技術;後者則選錄了全國范圍內常葯用植物百餘種加於介紹。每種內容包括名稱、來源、原植物形態特徵及功能主治等。每種植物還配有一幅精美的彩色圖畫。
此外「中國數字植物標本館」還辟有「網站建設介紹」、「信息反饋」和「相關網站」等欄目,其宗旨是為用戶提供全面而便捷的信息服務。

『伍』 地質遺跡資源和重要古生物化石調查

一、部署重點

開展廣西區、貴州省、上海市、江西省、湖南省、廣東省、海南省、湖北省、安徽省、江蘇省、北京市、河北省、山東省、天津市、新疆區、內蒙古區、甘肅省、寧夏區、西藏區、青海省、黑龍江省、吉林省、遼寧省、陝西省、山西省等25省(市、區)地質遺跡調查。全面完成全國省(市、區)地質遺跡調查工作。

開展全國重要古生物化石產地調查。

開展全國地質遺跡資源區劃研究、全國地質遺跡保護規劃研究、全國重要地質遺跡調查集成與綜合研究,編制全國地質遺跡資源分布系列圖,建設全國地質遺跡調查資料庫。

開展古生物化石保護名錄研究、古生物化石保護區劃研究,編制古生物化石保護區劃圖,建設全國地質遺跡資料庫。

二、部署建議

1.工作現狀

目前全國已批准182個國家地質公園用於開展地質遺跡保護工作,已建成的國家地質公園有127個,省級地質公園78個。已有部分單位和部門完成了《華東地區重要地質遺跡登錄、鑒評與保護研究》、《地質遺跡管理信息資料庫》、《全國重點地區地質遺跡區劃》等成果。全國已有包括安徽、湖南、新疆、山西、江蘇、江西等12省(區)進行地質遺跡初步調查和保護規劃研究的探索性工作;完成了《重要地質遺跡調查技術要求》初稿編制。但現有調查,一是覆蓋面不夠、深度不夠、缺乏系統性;二是缺乏科學統一的技術規范與評價體系;三是缺少全國性的地質遺跡保護與利用規劃和區域性規劃。

2.工作目標

總體目標:在「十二五」期間全面完成全國地質遺跡和重要古生物化石的調查工作,全面了解其分布特徵、重要價值,保護現狀和開發利用潛力。完成全國各省(市、自治區)地質遺跡資源調查報告、地質遺跡資源資料庫;完成全國各省(市、自治區)重要古生物化石調查報告、重要古生物化石產地資料庫;編制全國地質遺跡資源分布系列圖、重要古生物化石產地分布系列圖;提交《全國地質遺跡資源區劃》和《重要古生物化石產地保護規劃》。

對全國地質剖面類、地質地貌類和地質災害類地質遺跡進行匯總分析和統計,研究其分布特點、科學研究價值、主要成因及保護開發利用現狀;調查重要古生物化石產地的分布和保護現狀,建立古生物保護名錄;建立全國地質遺跡管理資料庫和重要古生物化石產地資料庫;編制全國地質遺跡和重要古生物化石產地分布圖;開展全國地質遺跡資源區劃和重要古生物化石產地保護規劃研究工作,為地質遺跡保護和開發利用提供技術基礎支撐。

3.工作任務

開展各省地質遺跡資源和重要古生物化石調查,查明地質遺跡資源和重要古生物化石資源狀況、分布特徵和重要價值,了解其保護和開發利用現狀;在各省調查工作的基礎上,開展綜合研究工作,編制全國地質遺跡資源分布系列圖和重要古生物化石產地分布圖,建立地質遺跡和重要古生物化石管理資料庫;開展全國地質遺跡資源區劃和重要古生物化石產地保護規劃研究,建立古生物化石保護名錄,編制古生物化石保護區劃和全國地質遺跡資源區劃。

分省級和全國兩個層次開展調查與研究。通過示範區調查,統一調查評價技術要求,逐步開展省級地質遺跡資源調查與保護規劃工作。在此基礎上開展全國地質遺跡資源區劃和重要古生物化石產地保護方案規劃研究,為省和國家地質遺跡資源和重要古生物化石的管理、保護與開發利用提供技術支撐。

開展全國29省(市、區)地質遺跡調查。制定技術要求和項目管理辦法;開展重要地區的重要地質遺跡調查研究工作;開展區劃研究和保護規劃研究。

『陸』 對於古生物化石檔案登記和資料庫管理,國土資源部與地方各級相關單位的職責各是什麼

《古生物化石保護條例》和《古生物化石保護條例實施辦法》中明確規定,古生物化石收藏單位應當建立古生物化石檔案,並將本單位收藏的重點保護古生物化石檔案報所在地的縣級以上人民政府國土資源主管部門備案。古生物化石收藏單位應當在檔案中如實對本單位收藏的古生物化石作出描述和標注,並根據收藏情況變化及時對檔案作出變更。古生物化石收藏單位對本單位的古生物化石檔案的真實性負責。

《古生物化石保護條例》第21條規定,國土資源部負責制定古生物化石檔案和資料庫建設標准,建立和管理全國的重點保護古生物化石檔案和資料庫。

縣級以上地方人民政府國土資源主管部門負責建立和管理本行政區域的重點保護古生物化石檔案和資料庫。收藏單位法定代表人變更時,應當辦理本單位收藏的古生物化石檔案移交手續,並在縣級以上地方國土資源主管部門備案。此外,《古生物化石保護條例實施辦法》第30條還要求省級國土資源主管部門負責登記個人手中收藏的重點保護古生物化石,並納入本行政區域內的古生物化石檔案和資料庫。

熱點內容
linux的系統函數 發布:2024-11-28 02:39:52 瀏覽:294
pm編程卡 發布:2024-11-28 02:39:50 瀏覽:563
convertsql 發布:2024-11-28 02:39:50 瀏覽:386
phpwap源碼 發布:2024-11-28 02:36:46 瀏覽:586
狂牛加密視頻破解 發布:2024-11-28 02:32:54 瀏覽:867
騰訊視頻上傳技巧 發布:2024-11-28 02:28:05 瀏覽:238
2016資料庫系統工程師 發布:2024-11-28 02:22:16 瀏覽:891
壓縮機飛動 發布:2024-11-28 02:00:04 瀏覽:273
50年腳本 發布:2024-11-28 01:58:38 瀏覽:220
光遇渠道服初音腳本怎麼換號 發布:2024-11-28 01:57:44 瀏覽:416