資料庫建設規范
『壹』 如何設計合理高效的資料庫
一、 引言資料庫對於企業信息化的重要性是不言而喻的。資料庫存儲著現代企業最重要的數據,包括生產、經營、管理等各類數據,這些數據作為企業的核心信息,通過各類信息系統,為用戶提供及時准確的信息,幫助用戶分析,為用戶提供決策依據。為提高企業的工作效率,提升企業形象,具有傳統模式無法比擬的優勢。其中構建合理高效的資料庫,是資料庫建設關鍵之一。如何構建合理高效的資料庫是企業信息化過程要解決的問題。下面就資料庫的構建談談自己的一些經驗,希望能對大家有所幫助。 二、 設計資料庫之前
資料庫並不是憑空想像出來的,而是根據業務部門的需要設計符合業務需求的資料庫。因此在形成資料庫之前需要充分了解業務需求。 1. 充分理解業務需求。需求分析是整個設計過程的基礎,是最困難、最耗費時間的一步。在這期間通過與業務部門交流,了解用戶的想法以及工作流程,通過雙方多次交流,會形成初步的數據模型,當然這時的數據模型不會是最終的模型,還需要和用戶進行交流,並且在以後的信息系統開發過程中還會反復修改。 2. 重視輸入輸出。在定義資料庫表和欄位需求(輸入)時,首先應了解數據產生源和數據流程,也就是必需要知道每個數據在那兒產生,數據在那兒表現,以什麼樣的形式表現等等,然後根據用戶提供的報表或者設計出的報表、查詢和視圖(輸出)以決定為了支持這些輸出哪些是必要的表和欄位。 3. 創建數據字典和ER 圖表。ER 圖表和數據字典可以讓任何了解資料庫的人都明確如何從資料庫中獲得數據。ER圖對表明表之間關系很有用,而數據字典則說明了每個欄位的用途以及任何可能存在的別名。對SQL 表達式的文檔化來說這是完全必要的。 需要注意的是,在需求分析調研過程中,並不是一帆風順的,因為業務人員對於業務的理解不同,以及對於信息知識的缺乏,會影響需求分析的質量,為了提高質量,各方要用更多的時間交流與相互理解,業務部門需要精通業務的人員自始至終全力配合,而開發人員則盡量使用用戶理解的業務術語交流,這樣會避免出現理解不同而產生的歧義。 三、 設計合理的表結構
通常合理的表結構會減少數據冗餘,提高資料庫的性能。設計合理的表結構要遵循以下兩點。 1. 標准化和規范化 數據的標准化有助於消除資料庫中的數據冗餘。標准化有好幾種形式,但3NF(第三範式)通常被認為在性能、擴展性和數據完整性方面達到了最好平衡。簡單來說,遵守3NF標準的資料庫的表設計原則是:某個表只包括其本身基本的屬性,當不是它們本身所具有的屬性時需進行分解。表之間的關系通過外鍵相連接。它具有以下特點:有一組表專門存放通過鍵連接起來的關聯數據。 例如:某個存放單井信息及其有關油井生產日報信息的3NF資料庫就有兩個表:單井基礎信息和油井日報信息。日報信息不包含單井的任何信息,但表內會存放一個鍵值,該鍵指向單井基礎信息里包含該油井信息的那一行。 不過也有例外,有時為了效率的緣故,對表不進行標准化也是必要的。 2. 考慮各種變化 在設計資料庫的時候考慮到哪些數據欄位將來可能會發生變更。使資料庫更具擴展性,從而減少將來數據變更所帶來的損失。 例如,日期類型欄位,有時我們會考慮使用字元類型代替日期類型,因為在處理日期欄位上容易產生數據錯誤,所以我們就使用字元類型。這樣的例子還很多,在做前期設計時都要考慮的。 表結構的設計不是一次就能成功的,在信息系統開發過程中會存在數據讀取、錄入或統計困難,為了解決這些問題會修改表結構,或增加一些欄位,或修改一些欄位的屬性。這個過程不斷重復,因此不要想一次能成功。建議使用專門設計工具來做這些工作,筆者經常使用:SYBASE PowerDesigner ,當然還有其它的工具:ORACLE Designer 2000 ,ROSE等工具。這樣會使你的工作事半功倍。 四、 選擇合理的索引
索引是從資料庫中獲取數據的最高效方式之一。95%的資料庫性能問題都可以採用索引技術得到解決。 1. 邏輯主鍵使用唯一的成組索引,對系統鍵(作為存儲過程)採用唯一的非成組索引,對任何外鍵列採用非成組索引。考慮資料庫的空間有多大,表如何進行訪問,還有這些訪問是否主要用作讀寫。 2. 大多數資料庫都索引自動創建的主鍵欄位,但是可別忘了索引外鍵,它們也是經常使用的鍵,比如運行查詢顯示主表和所有關聯表的某條記錄就用得上。 3. 不要索引大型欄位(有很多字元),這樣作會讓索引佔用太多的存儲空間。如MEMO(備注)、TEXT(文本)等欄位。 4. 不要索引常用的小型表 不要為小型數據表設置任何鍵,假如它們經常有插入和刪除操作就更別這樣作了。對這些插入和刪除操作的索引維護可能比掃描表空間消耗更多的時間。如代碼表,或系統參數表。 五、 保證數據完整性
數據的完整性非常重要,這關繫到數據的准確性,不準確的數據是毫無價值的,因此保證數據的完整性非常重要。 1. 完整性實現機制:實體完整性:主鍵參照完整性: 父表中刪除數據:級聯刪除;受限刪除;置空值父表中插入數據:受限插入;遞歸插入 父表中更新數據:級聯更新;受限更新;置空值 DBMS對參照完整性可以有兩種方法實現:外鍵實現機制(約束規則)和觸發器實現機制用戶定義完整性:NOT NULL;CHECK;觸發器 以上完整性機制需要熟悉和掌握,它對於數據的完整性非常重要。 2. 用約束而非業務規則強制數據完整性 採用資料庫系統實現數據的完整性。這不但包括通過標准化實現的完整性而且還包括數據的功能性。在寫數據的時候還可以增加觸發器來保證數據的正確性。不要依賴於業務層保證數據完整性;它不能保證表之間(外鍵)的完整性所以不能強加於其他完整性規則之上。 3. 強制指示完整性 在有害數據進入資料庫之前將其剔除。激活資料庫系統的指示完整性特性。這樣可以保持數據的清潔而能迫使開發人員投入更多的時間處理錯誤條件。 4. 使用查找控制數據完整性 控制數據完整性的最佳方式就是限制用戶的錄入。只要有可能都應該提供給用戶一個清晰的價值列表供其選擇。這樣將減少鍵入代碼的錯誤和誤解同時提供數據的一致性。某些公共數據特別適合查找:性別代碼、單位代碼等。 5. 採用視圖 視圖是一個虛擬表,其內容由SQL語句定義,視圖不僅可以簡化用戶對數據的理解,也可以簡化他們的操作。那些被經常使用的查詢可以被定義為視圖,從而使得用戶不必為以後的操作每次指定全部的條件。另外通過視圖用戶只能查詢和修改他們所能見到的數據。資料庫中的其它數據則既看不見也取不到。資料庫授權命令可以使每個用戶對資料庫的檢索限制到特定的資料庫對象上,增強數據的安全性。 六、 結束語
資料庫的高效運行不僅需要技術上的支持,也需要硬體平台和網路的支持以及資料庫管理員的有效管理,本文只是從技術的角度說明如何提高資料庫的效率,但在實際應用過程中其它方面的支持也是不可缺少的,尤其是資料庫管理,資料庫建設是「三分技術,七分管理,十二分基礎數據」,因此對於資料庫管理一定要重視,在管理到位的情況下技術才能發揮應有的作用。
『貳』 數據標准
為確保系統各資料庫與各功能模塊之間的數據分類、編碼及數據文件命名的系統性和唯一性,滿足系統正常高效運行以及與其他相關系統協同運作的要求,實現系統之間相互兼容、信息共享,資料庫建設時必須遵循有關的標准規范。需參照的標准規范如下:
GB/T2260—98 中華人民共和國行政區劃代碼
GB/T2808—81 全數字式日期表示法
GB/T9649—88 地質礦產術語分類代碼
GB/T13923—92 國土基礎信息數據分類代碼
DZ/T0001—91 區域地質調查總則(1:50000)
DZ/T0157—95 1:50000地質圖地理底圖編繪規范
DZ/T0160—95 1:200000地質圖地理底圖編繪規范及圖式
DDB9702 GIS圖層描述數據內容標准
地質圖空間資料庫建設工作指南 中國地質調查局
DDZ9701 資源評價工作中地理信息系統工作細則
DZ/T 0179—1997 地質圖用色標准及用色原則
DD2005—01 多目標區域地球化學調查規范(1:25萬)中國地質調查局
DD2005—02 區域生態地球化學評價技術要求 中國地質調查局
DD2005—03 生態地球化學評價樣品分析技術要求 中國地質調查局
GB/T17296—2000 中國土壤分類與代碼
GB/T13989—92 國家基本比例尺地形圖分幅編號
DZ/T0167—1995 區域地球化學勘查規范(1:200000)
GB/T18507—2001 城鎮土地分等定級規程
GB/T17296—2000 中國土壤分類代碼
『叄』 分等資料庫的建設
(一)農用地分等數據的組成
農用地分等數據成果豐富,按照農用地分等的流程可分為自然質量分、自然質量等指數、自然質量等別、土地利用系數、土地經濟系數、利用等指數、利用等別、經濟等指數和經濟等別;按照農用地分等數據的性質可分為空間數據、屬性數據、文本數據。為使農用地分等成果能夠方便、直觀地展現國家級、省級、縣級、鄉級各級農用地的質量與數量特徵,實現對農用地分等數據的查詢、分析、融合、分發等功能,必須建立一套統一、規范化的數據管理體系。這套體系能夠從農用地分等的基礎資料、中間成果和農用地分等成果(圖、文、表)等海量數據中提取信息,供匯總平衡、調整、分析,為各級政府部門制定相關政策提供技術支持,是土地信息化的堅實基礎,對各級農用地的數據(包括屬性數據和矢量數據)進行更新、查詢、檢索和集成,建設農用地分等資料庫。
農用地分等資料庫的建設是實現土地資源數量、質量、產能與生態環境並重管理及國土信息化工程建設的基礎保障,是實現國土資源現代化管理、社會化服務的必要前提,也是各級政府和國土資源管理部門切實保護基本農田、實施耕地佔補按等級折算的重要手段。廣西壯族自治區農用地分等自治區級與縣級農用地分等成果主要包括文字成果、圖件成果、數據成果和電子成果。
1.文字成果
文字成果主要包括自治區級與縣級農用地分等技術報告(包含縣級農用地分等基礎資料匯編等)。農用地分等技術報告主要包括4個方面的內容:一是分等對象所在區域的自然、經濟和社會概況;二是分等技術方法,包括分等參數的確定,分等因素指標區、分等單元、土地利用系數等值區與土地經濟系數等值區的劃分方法,分等因素及其分值和權重的確定方法,等別劃分方法,分等成果檢驗與調整方法,計算機技術在分等中的應用以及其他需要說明的技術問題等;三是分等成果及其分布特點和規律、地域組合特點、差異原因、農用地利用中存在的主要問題等;四是分等成果的應用分析。
2.圖件成果
圖件成果具體包括分等單元圖、農用地自然質量等別分布圖、農用地利用等別分布圖、農用地經濟等別分布圖、標准樣地分布圖。
3.數據成果
數據成果包括廣西壯族自治區的農用地分等單元原始屬性數據表、樣點投入產出調查數據表、農用地分等基本參數表、各指標區「指定作物-分等因素-自然質量分」記分規則表、農用地分等各指標區分等因素體系及其權重表、土地利用系數與土地經濟系數匯總表、土地利用系數等值區間表、土地經濟系數等值區間表、自治區級農用地分等單元指定作物計算結果表、自治區級農用地分等單元多作物綜合計算結果表、農用地分等結果各鄉(鎮)面積匯總表、農用地分等結果各地類面積匯總表、自治區級農用地分等單元綜合數據表、農用地標准樣地屬性數據表等,部分表格見附錄。
4.電子成果
廣西壯族自治區農用地分等電子成果用光碟或硬碟保存,提交的農用地分等成果包括文字、圖件和數據等成果的電子版本。
(二)農用地分等資料庫建設的依據與內容
1.農用地分等資料庫建設的依據
農用地分等資料庫建設首先要依據分等數據的特點:一是信息量巨大;二是數據與信息種類多種多樣,按數據的特徵分為屬性數據和矢量數據,按數據的來源和性質分為農用地自然屬性和社會經濟屬性,這些數據涉及土地學、農業學、地理學、測繪學、信息學和經濟學等眾多學科;三是成果具有復雜多層次的特徵。其次,依據《農用地分等資料庫標准》,農用地分等成果數據的內涵、特點及其應用需求,設計農用地分等資料庫建設方案,按照《農用地分等規程》對農用地分等的各個環節及其成果數據進行整合加工標准化處理,把農用地分等成果的矢量數據和屬性數據,通過關聯式數據系統儲存、管理、整合在一起,建立統一、規范的農用地分等資料庫。
2.農用地分等資料庫建設的內容
農用地分等資料庫建設的內容主要包括農用地分等數據的分類編碼、農用地分等數據的圖形要素分層、農用地分等數據的屬性數據結構、分等單元擴展屬性結構、外部表格信息和農用地分等數據文件命名6個方面的內容。
農用地分等數據的分類編碼包括基礎地理信息分類與編碼、土地利用信息分類與編碼和分等基礎信息分類與編碼。
農用地分等數據的屬性數據結構內容復雜,主要包括基礎地理、土地利用類圖層屬性表、注記屬性表結構、縣級分等基礎層屬性表結構、縣級分等結果層屬性表結構、自治區級分等基礎層屬性表結構、自治區級分等結果層屬性表結構等內容。
分等單元擴展屬性結構包括指定作物分等計算結果表結構和縣級綜合等別計算表結構。
外部表格信息包括指定作物參數表結構、「指定作物-分等因素-分值」說明表結構、「指定作物-分等因素-權重」說明表結構、標准樣地屬性特徵基準分值表結構、「縣級-自治區級」農用地分等單元對應表結構、縣級文檔結果和自治區級文檔結果。
農用地分等數據文件命名規則包括以行政區為基礎的數據文件命名規則和文檔數據文件命名規則等內容。
(三)資料庫系統的設計思想和目標
廣西壯族自治區農用地分等數據管理信息系統的設計思想是以地理信息系統(GIS)為平台,在計算機軟硬體支持下,把各種地理信息按照空間分布,以一定的格式輸入、存儲、檢索、更新、顯示、制圖和綜合分析的計算機技術系統。利用該系統,通過對農用地諸多因素(自然因素和社會經濟因素)的綜合分析,找出農用地變化的特點與規律,從而迅速地獲取滿足應用需要的信息,並能以地圖、圖形或數據的形式表示處理的結果。
1.系統的設計思想和目標
廣西壯族自治區農用地分等數據管理信息系統的設計是在充分研究和總結土地利用管理的實際工作需求和吸收目前計算機技術在土地管理中的應用經驗的基礎上,結合國土資源部新一輪國土資源大調查中《縣級土地利用資料庫標准》和《縣(市)級土地利用資料庫建設技術規范(徵求意見稿)》而制定的。系統的設計綜合了以下幾方面的技術:①數字制圖技術;②計算機的自動查詢、檢索分類、計算統計技術;③空間查詢和分析技術;④空間信息的存儲管理技術;⑤計算機網路技術。配套統一以上技術,將地理信息系統(GIS)技術應用到系統的設計中,形成系統基本的設計思想,即按照農用地分等數據的規范和標准,建立起農用地分等數據管理的技術路線和工藝流程,按照GIS的要求嚴格控制入庫數據的精度;提供方便、快捷的實用工具,提高資料庫的利用率和滿足國土資源管理部門的工作需求;利用地理信息系統中的空間分析功能,完成對資料庫的動態更新,維持資料庫的現勢性。
廣西壯族自治區農用地分等數據管理信息系統設計的基本目標是滿足國土資源管理部門對農用地分等數據的管理需求,提高土地管理的效率和質量,並且充分利用計算機技術來減輕土地管理工作的勞動強度,最終實現土地管理的信息化,構建「數字國土」工程的基礎設施。
2.數據入庫
數據入庫前要檢查採集數據的質量,檢查合格的數據方可入庫。數據檢查主要包括矢量數據幾何精度和拓撲檢查、屬性數據完整性和正確性檢查、圖形和屬性數據一致性檢查、接邊精度和完整性檢查等。數據入庫主要包括矢量數據、DEM數據、DOM數據、元數據等數據的入庫。最後進行系統測試(圖3-17)。
圖3-17 入庫工作流程圖
數據入庫前要對採集數據進行全面質量檢查,並對錯誤進行改正,數據的檢查與更正是數據建庫中至關重要的一步。
(1)按照《縣級土地利用資料庫標准》、《農用地分等規程》等相關標准確定檢查項,包括矢量數據幾何精度和拓撲檢查、屬性數據完整性和正確性檢查、圖形和屬性數據一致性檢查、接
邊完整性檢查等。
(2)基於上述檢查項,定製檢查內容,配置相應的參數。
(3)按照定製的內容,系統自動實現批量檢查,也可以採用人機交互方式對重點內容進行檢查,對發現的錯誤及時修正。
(4)自動生成或手工編寫檢查報告,檢查與更正工作結束(圖3-18)。
圖3-18 數據檢查流程圖
1)矢量數據入庫
(1)數據檢查。數據入庫前,對矢量數據質量進行全面檢查,並記錄檢查結果,對質量不合格的數據應予以返工,質量檢查合格的數據方可入庫。
(2)參數輸入及其數據組織入庫。依據參數設置的要求,向資料庫管理系統中輸入各種建庫參數,對不同數據層的數據建立索引等,各要素數據可分層入庫,也可批量入庫。
(3)多尺度空間數據連接設置。對於多尺度空間資料庫應設置連接參數,便於不同比例尺數據的顯示。
2)元數據入庫
利用資料庫管理軟體,採用人工和自動相結合的方法對各要素元數據內容進行檢查和處理,導入各種元數據。
3)屬性入庫
利用Excel軟體輸入分等評價單元質量分值表,形成分等評價單元自然屬性電子表格文件;再將各評價單元的土地利用系數和土地經濟系數進行匯總,劃分各等值區;然後,匯總到分等評價單元自然屬性表中,計算農用地分等單元的自然質量等指數、利用等指數和經濟等指數;利用相關軟體將整個Excel總表轉換到資料庫中,存為DBASE格式文件;最後,根據關鍵屬性欄位掛接,使圖、表合一,形成統一的空間資料庫。
4)系統運行情況
數據入庫完成後,對系統進行全面的測試;並對測試出現的問題進行全面分析和處理。
具體測試內容及要求為系統運行無死機現象;系統能對資料庫中數據層進行組合查詢,且數據結構正確;系統能夠對數據進行匯總統計並輸出相關表格成果;系統能按要求輸出相關圖件,等等。
(四)系統設計總體框架圖
廣西壯族自治區農用地分等評價數據管理系統橫向包括農用地調查評價基礎業務工作,縱向涵蓋國家、省、市、縣四級國土資源管理部門,其總體框架如圖3-19和圖3-20。
圖3-19 總體框架橫向結構圖
圖3-20 總體框架縱向結構圖
(五)資料庫系統功能的實現
依據農用地分等成果和土地利用管理的需求,該系統應具有以下基本功能:
1.系統建庫
系統建庫是指把農用地分等成果及其涉及的信息用計算機存儲起來,它具有兩個方面的含義:一是全面進行數字化建庫,採用MapGIS的數據結構和幾何特徵的描述術語,輸入農用地分等數據;還可在已有的圖形資料庫的基礎上進行建庫,可利用MapGIS平台提供的數據轉換和屬性管理工具把圖形和屬性轉換到系統中來;二是變更數據,根據農用地分等進展情況,及時更新農用地分等數據信息系統。
2.數據查詢和檢索
數據查詢和檢索模塊是系統的主要功能模塊。該系統提供了強大的地圖瀏覽、圖層控制、空間索引、查詢統計、空間分析和報表輸出等功能,為實現統籌數量、質量與生態並重管理,建設資源節約型社會提供了良好的手段;同時,也滿足公眾參與管理農用地分等數據的功能,加大土地科學普及工作,樹立全社會關注農用地資源安全、耕地保護與國家糧食安全的意識;通過模糊查詢、條件查詢、空間查找等具體功能可以快速查詢村、國家級基本農田、地類圖斑等重要對象的空間位置和屬性信息;能對縣(市、區)各級數據進行實時動態的統計匯總,並可用專題圖的形式對不同區域的農用地分等數據按不同的指標進行對比分析,可以輸出各種圖形和報表;可以根據不同的業務需要,設計不同的數據應用分析模型,例如征地分析模型、土地開發整理前後質量評價模型、土地利用變化模型等。通過系統,按這些模型進行處理,輸出分析結果,從而有效地促進國土資源管理工作的信息化、科學化、專業化,提高辦事效率,避免決策失誤。
3.成果輸出
依據農用地分等制圖規范和土地利用管理需求,輸出農用地分等圖形和數據成果;還可以按行政區域及任意區域裁剪圖件等。
4.系統維護
該系統是按照國家的有關規程和標准進行設計的,可根據土地管理實際情況做進一步的編碼和更新,滿足國土資源管理工作的實際需要。
『肆』 地質-生態環境空間資料庫建庫標准
一、范圍
本標準定義了山東半島城市群地質-生態環境空間資料庫的數據結構框架、數據實體及實體之間的相互關系,定義了成果圖件空間數據的要素集、要素類、要素分類代碼及屬性數據項,可用於山東半島城市群項目數據的採集、存儲、管理、共享及資料庫建設。
二、規范性引用文件
下列標准所包含的條文,通過在本標准中引用而構成為本標準的條文。本標准出版時,所示版本均為有效。所有標准都會被修訂,使用本標準的各方應探討使用下列標准最新版本的可能性。
GB / T 1. 1—2000 標准化工作導則 第 1 部分: 標準的結構和編寫規則
GB / T 13923—92 國土基礎信息數據分類代碼
GB / T 2260—1999 中華人民共和國行政區劃代碼
GB / T 2659 世界各國和地區名稱代碼
GB / T 9649—88 地質礦產術語分類代碼
DZ / T 0160—95 1∶ 200000 地質圖地理底圖編繪規范及圖式
DZ / T 0197—1997 數字化地質圖圖層及屬性文件格式
GB 958—99 區域地質圖圖例 ( 1∶ 50000)
DZ / T 0179—1997 地質圖用色標准及用色原則
DDB 9702 GIS 圖層描述數據內容標准
GB 17108—1997 海洋功能區劃技術導則
中國地質調查局 地質圖空間資料庫建設工作指南 ( 2. 0 版)
中國地質調查局 1∶ 20 萬區域水文地質圖空間資料庫圖層及屬性文件格式工作指南
三、術語和定義
本標准涉及的主要術語如下:
1. 地理信息資料庫 ( geodatabase)
採用標准關系資料庫技術來管理、表現地理信息的空間資料庫。
2. 數據包 ( data package)
邏輯相關數據實體的集合,本標准中將山東半島城市群項目數據整體視作一個數據包。
3. 數據實體 ( data entity)
描述專業領域同一類型數據的數據元素的集合,如地質構造數據實體,概念上等同於UML 的類。數據實體可通過一個或多個相關的數據元素及相關的數據實體定義。
4. 數據集 ( dataset)
邏輯相關數據組成的數據集合,如一幅地圖可視作一個數據集,數據集是一個邏輯上的整體。
5. 數據子集 ( subdataset)
按一定規則劃分的數據集中邏輯相關數據的集合,本標准中的一個數據子集對應一個地圖要素類,數據子集類別對應地圖上的圖層劃分。
6. 空間數據 ( spatial data)
用來表示空間實體的位置、形狀、大小和分布特徵諸方面信息的數據。空間數據不僅具有實體本身的空間位置及形態信息,而且還有實體屬性和空間關系 ( 如拓撲關系)信息。
7. 空間參照系 ( spatial reference)
對地理信息數據的空間范圍和投影的描述。
8. 地圖 ( map)
地理信息的圖形描述,包括地理信息數據和地圖元素,如標題、圖例和比例尺等。本標准中將一幅地圖視作一個數據集進行管理,並通過一組要素集 ( 要素類、關系類、屬性表的集合) 、空間參照系、地圖樣式定義地圖的數據內容及顯示方式。
9. 圖層 ( layer)
地圖上特定區域范圍內按一定規則劃分的相似要素類的集合,如水系、城鎮。圖層為要素類的專題組合及表現,一個圖層定義了它包含地理信息數據的地理位置和顯示方法。
10. 要素 ( feature)
現實世界中的對象在地圖圖層中的表示,如地圖中表示道路的一條線。
……
四、縮略語和符號
1. 縮略語
ARD 圖外整飾要素 ( Elements Around Map)
BMAP 地理底圖 ( Basemap)
BOU 境界、邊界 ( Bourn)
CD 代碼 ( Code)
COL 綜合柱狀圖 ( Colomnar Chart)
DT 日期 ( Date)
ELE 地形高程 ( Elevation)
……
2. UML 類圖符號
山東半島城市群地區地質-生態環境與可持續發展研究
3. ER 圖符號
山東半島城市群地區地質-生態環境與可持續發展研究
五、基於 UML 的 Geodatabase 的空間數據模型
構建地質數據的空間數據模型是建立地質信息資料庫的一項關鍵工作,是資料庫建設的基礎。Geodatabase 數據模型作為 ArcGIS 軟體平台的一種通用數據形式,目前已被國內外眾多地質空間資料庫的建設所採用。數據建模也已經成為地質資料庫建立的一項主要內容。
目前針對地質、水文、礦產、海洋等多個領域的專業 Geodatabase 數據模型都已存在,國內目前應用於區域地質 - 生態環境調查的綜合地質 - 生態環境空間數據模型還比較少見。因此,本項目在分析國內外目前比較通用的各專業數據模型的基礎上,提出了專門面向山東半島城市群地質 - 生態環境空間資料庫建設的 Geodatabase 數據模型。
在 Geodatabase 數據模型中,允許定義要素之間類型的關聯,Geodatabase 對空間數據管理以關系資料庫為基礎,利用商用關系資料庫成熟的數據處理能力對空間數據和非空間數據進行統一管理。Geodatabase 使用面向對象的方法,使得要素可以具有自己的行為和屬性,並且要素類具有繼承性、多態性和封裝性。這樣,以更加適合自然的行為和人的思維方式去組織數據,更精確地模擬真實世界。
1. Geodatabase 數據模型的結構體系
Geodatabase 數據模型作為一種新型的面向對象的數據模型,融入了面向對象的核心技術,如類 ( Class) 、對象 ( Object) 、封裝 ( Encapsulation) 、繼承 ( Inheritance) 和多態( Polymorphism) 等思想和技術。Geodatabase 數據模型的目的就是為了讓用戶能更容易、更自然地表示 GIS 數據特徵和更容易地建立特徵之間的各種關系。Geodatabase 空間資料庫數據模型如表 12 -1 所示。
表 12 -1 Geodatabase 內部結構
續表
2. Geodatabase 資料庫模型的特點
Geodatabase 有兩種,即個人與多用戶 Geodatabase。
1) 個人 Geodatabase 支持內置於 ArcGIS 系統並提供對本地數據的訪問,適用於面向項目的 GIS,在 Microsoft Access 資料庫平台上實現,提供生成和更新 Access 資料庫的服務,可處理小型或適中的 Access 資料庫。但個人 Geodatabase 的存儲容量有不能超過 2GB的限制。
2) 多用戶的 Geodatabase 是通過 ArcSDE ( ARC 空間資料庫引擎) 實現的。ArcSDE可以生成和訪問從小型到大型的 Geodatabase 並提供關系型數據的開放界面。
與標準的關系資料庫相比,Geodatabase 簡化了地理數據建模的工作,因為它包含有用於建模地理信息的通用模型。
此外,Geodatabase 還同時支持兩個視圖,即對象視圖和關系視圖。這樣就綜合了對象視圖和關系視圖兩者的優點。對象視圖在 Geodatabase 中占據主導地位,其目的是提供一個接近於邏輯數據模型的數據模型,因而更接近於現實。關系視圖則用於一些 Geodata-base 數據的常規處理,它表示的是一些簡單地理對象的特徵。
3. 基於 UML 的 Geodatabase 數據模型的設計
( 1) Geodatabase 資料庫設計的方法
在 ArcGIS 中,建立地理資料庫可以有多種方法。藉助 ArcCatalog,可以通過 3 種方式建立新的地理資料庫。
第一種方法是建立一個新的地理資料庫。
第二種方法是移植已經存在的數據到地理資料庫中去。
第三種方式是用 CASE 工具來建立地理資料庫。
( 2) 面向對象和 UML ( 統一建模語言)
面向對象是軟體程序設計中的一種新思想,它能使程序設計更加貼近現實,並且花費更小的精力。面向對象方法學包含了對象 ( object) 、類 ( classification) 、繼承 ( inherit-ance) 、聚集和消息 ( messages) 的概念。
UML ( Unified Modeling Language,統一建模語言) 是一種基於面向對象方法的建模語言,具有創建系統的靜態結構和動態行為等多種結構模型的能力,是一種通用的建模語言。在 Geodatabase 的設計中,主要用到描述系統靜態結構的類圖。類圖的節點表示系統中的類及其屬性和操作。類圖的邊表示類之間的聯系,包括繼承、關聯、依賴、聚合等。
類的表示由 3 個部分方框組成,上面部分給出了類的名稱; 中間部分給出了該類的單個對象的屬性; 下面部分給出了一些可以應用到這些對象的操作。類的表示如圖 12 -5。
圖 12 -5 類的表示
關聯是對類的實例之間聯系的命名,與關聯有關的內容有關聯元數 ( Degree) 、關聯角色 ( Role) 和重復度 ( Multiplicity) 。
UML 中有 3 種類型的類: 抽象類 ( abstract class) 、可創建化類 ( creatable class) 和可實例化類 ( instantiable class) 。
UML 類圖的符號見本節第四部分內容。
( 3) 面向對象的地理數據模型的設計方法
利用 CASE 工具進行 Geodatabase 數據模型設計的步驟具體為:
1) 在 CASE 工具中進行 UML 建模。
2) 將設計好的 UML 模型載入資料庫 ( repositry) 。
3) 利用 GIS 軟體提供的 CASE 介面,根據資料庫中的 UML 模型生成空間資料庫結構。至此,Geodatabase 空間資料庫結構初具雛形。在 GIS 軟體環境中,現在可以將新生成的數據或已有的數據進行格式轉換後載入到設計好的 Geodatabase 空間資料庫中,由空間資料庫統一管理。利用 CASE 工具來建立 Geodatabase 地理資料庫的工作流程見圖12 - 6。
圖 12 -6 利用 CASE 工具來建立 Geodatabase 地理資料庫的工作流程
六、地質 - 生態環境 Geodatabase 數據模型的建立
( 一) 數據模型設計的依據
根據山東半島城市群地質 - 生態環境調查評價研究工作的需要和山東半島城市群地質 - 生態環境 GIS 資料庫系統的整體設計要求,結合各地質 - 生態環境要素的成果圖件和文本報告資料,利用 UML 設計工具 Microsoft Visio 完成了山東半島城市群地質 - 生態環境Geodatabase 數據模型的設計 ( 圖 12 - 7) 。
圖 12 -7 山東半島城市群地質 - 生態環境 Geodatabase 數據模型的設計依據
( 二) 山東半島城市群地質 - 生態環境資料庫的 UML 類圖
1. 數據集管理
山東半島城市群項目數據包中的數據以數據集為單元統一組織管理,數據集管理方式就是將一份文字報告或一幅成果圖件視作邏輯上的整體,用 「數據集編號」唯一標識,通過數據集實體統一管理。同一數據集的不同實體,例如成果圖中的圖層,通過實體中的「數據集編號」元素關聯。
2. 空間數據管理
山東半島城市群項目數據包由文字報告及成果圖件兩大類數據組成,並以成果圖件為主,成果圖件是一空間數據實體,統一存儲在面向對象的地理信息資料庫中,以圖幅為單元進行管理。
3. 數據包總體結構
本標准中山東半島城市群項目數據包總體結構用 UML 模型來體現,山東半島城市群項目數據包由 「成果報告」、「元數據」及 「存檔文件」3 個數據實體 ( UML 類) 組成,通過 「數據集」實體統一組織管理。「成果報告」由它的繼承類 「文字報告」及 「成果圖件」定義,為研究成果數據包的主體數據。「元數據」及 「存檔文件」為數據集的輔助數據,「元數據」存放文字報告或成果圖件的元數據; 「存檔文件」存放文字報告或成果圖件的相關存檔文件,供數據集數據的整體下載與利用。
一個 「數據集」實體對應一個項目的 「文字報告」或一幅 「成果圖件」; 每一個數據集必須有一個而且只能有一個 「元數據」文件; 「存檔文件」是 「數據集」的可選聚合實體。
「成果圖件」是一空間數據實體,由特定的面向對象地理信息資料庫 ( Geodatabase)統一存儲、管理。一幅 「成果圖件」數據內容由一組空間要素集 ( 基礎地理要素集、地質要素集、地球物理要素集、地球化學要素集、輔助要素集) 組成,空間要素集數據類型包括矢量 ( Feature Dataset,簡稱要素集) 、柵格 ( Raster Dataset) 和 TIN ( TIN Dataset)3 種。
4. 數據集編號的編碼規則
數據集編號由資料庫管理方統一編碼,必須保證編號在資料庫中唯一,編號中的英文字母全部大寫。
山東半島城市群項目數據集按 「項目或圖幅—提交單位—提交年份—成果序號」編碼。數據集編號的字元串長度不得超過 22 位,以保證 「數據集編號 + 要素類名」的字元串總長度不超過 30 位。
5. 成果圖件要素類命名規則
要素類名字元串總長度不得超過 8 位。
矢量要素類按 「要素集類型 + 要素類名 + 要素類型」命名,全部用大寫英文字母表示。「要素集類型」用一位代碼表示,如 「L」表示基礎地理要素集。柵格數據集數據以「要素集類型 + 要素類型」命名,要素類型用代碼 RAS 表示,如 「DRSRAS」表示遙感柵格數據。TIN 數據集數據以 「要素集類型 + 要素類型」命名,要素類型用代碼 TIN 表示,如 「LELETIN」表示地面高程 TIN。
6. 成果圖件要素分類編碼規則
要素分類編碼用以標識不同的要素類要素,保證地圖要素存儲、交換、顯示的一致性。
( 1) 分類編碼原則
1) 科學性、系統性;
2) 相對穩定性;
3) 不受地圖比例尺的限制;
4) 完整性和可擴展性;
5) 適用性。
( 2) 分類編碼方法
成果圖件要素類中不同要素的分類編碼採用中華人民共和國國家標准 《國土基礎信息數據分類與代碼》的編碼結構,結構如下:
山東半島城市群地區地質-生態環境與可持續發展研究
大類碼、小類碼、一級代碼和二級代碼分別用數字順序排列。識別位由用戶自行定義,以便於擴充。在本項目中編碼分兩類: ①基礎地理要素編碼; ②地質專業要素編碼( 地質、地球物理、地球化學等) 。
( 三) 山東半島城市群項目數據實體及實體關系
山東半島城市群項目數據實體類及其代碼見表 12 -2,實體類名代碼按實體類的英文名縮略語編碼,本標准中山東半島城市群項目數據實體及實體間關系用 UML 及實體關系圖 ( ERD) 來體現。
表 12 -2 山東半島城市群項目數據實體類及其代碼
1. 數據集實體 ( MGRD_Dataset)
山東半島城市群項目數據包中的 「數據集」實體用來統一組織管理 「文字報告」、「成果圖件」、「元數據」及 「存檔文件」數據實體,「數據集」實體中的數據項包含數據集的歸屬項目、提交日期、提交單位、主題類別及地理范圍等可用於數據集檢索的信息。一個 「數據集」實體對應一個項目的 「文字報告」或一幅 「成果圖件」,「數據集」實體與 「元數據」實體間為一一對應關系,與 「存檔文件」實體間為一對多的對應關系。「數據集」實體的數據內容及其存儲表通過 「數據子集」實體分類定義,主鍵 [數據集編號]可用於同一數據集中不同 「數據子集」的關聯,也可用於數據集對應的 「元數據」及「存檔文件」的關聯。
2. 成果報告數據實體 ( MGRD SumTmaryReport)
研究成果報告數據實體包括項目的最終綜合文字報告及相應的成果圖件。
( 1) 文字報告數據實體 ( SR_WordReport)
文字報告數據實體包括 「文字報告」及圖像格式的 「報告附圖」數據實體,文字報告及附圖均以二進制大對象存儲。數據實體之間通過 [數據集編號] 關聯。
( 2) 成果圖件數據實體 ( SR_hemeMapSet)
「成果圖件」數據實體是一空間數據實體,主要以矢量圖形格式存儲在地理信息資料庫中,其中也包括柵格數據及 TIN 數據用於數據的空間分析。
1) 要素集: 「成果圖件」 數據實體以圖幅為數據集單元進行管理; 圖幅內容以分屬不同空間要素集 ( 基礎地理要素集、地質要素集、地球物理要素集、地球化學要素集、輔助要素集) 的要素類組合,同一個要素集內的要素類享有同一空間參照系,相互具有拓撲關系。
2) 要素類: 一個要素類的存儲單元為關系資料庫中的一個數據表,要素類圖元類型有點、線、面、注記 4 種,一個要素類只能包含一種圖元類型。本標准中基礎地理要素集、地質要素集、地球物理要素集、地球化學要素類、輔助要素集的要素類用 UML 類圖體現。
3) 圖層: 圖層為要素類的專題組合及表現,不同圖層的組合即構成了可視化 「成果圖件」。本項目通過對數據來源的分析,提出並建立了適合山東半島城市群地區地質 - 生態環境調查與評價特點的空間資料庫數據圖層。考慮到空間數據的應用和相互轉換,每一圖層均應建立相應的內部屬性表,屬性表必須包含一些基本欄位內容,根據具體任務的不同,需靈活擴充內部屬性表欄位內容。 「成果圖件」數據實體的圖層劃分及其代碼見表 12 -3。
4) 要素類屬性: 要素類的要素特徵由屬性表定義,屬性表每一行對應一個要素,每一列包含要素的一個特徵信息。
表 12 -3 成果圖件數據實體的圖層劃分及其代碼
5) 要素類要素分類: 同一要素類中不同類型的要素用不同的代碼標識,通過屬性表中的 「編碼」 ( GEO_CODE) 數據項體現,以便地圖中同一要素類要素的分類顯示,並保證地圖要素存儲、交換、顯示的一致性。在本項目中成果圖件的基礎地理要素分類代碼採用中華人民共和國國家標准 《國土基礎信息數據分類與代碼》,並根據需要進行了擴充,地質專業要素分類代碼全部由本標準定義,見表 12 -4 和表 12 -5。
表 12 -4 基礎地理要素分類代碼
表 12 -5 地質專業要素分類代碼
圖12 -8 山東半島城市群項目數據包UML類圖
圖層編碼中,第一位為圖類代碼,L 代表基礎地理類圖層; D 代表基礎地質類圖層;G 代表國土資源圖層; W 代表地殼穩定性圖層; S 代表水資源圖層; H 代表海岸帶圖層;T 代表生態環境圖層; R 代表人類工程活動圖層; F 代表分析評價圖層; Y 代表預測與防治圖層; Z 代表輔助圖層。第二位為比例尺代碼,圖件均採用 1∶ 50 萬比例尺,代碼為 B。第三位到第五位為圖名的漢語拼音首字母縮寫。第六位為圖層數字編號。
( 四) 山東半島城市群項目 UML 類圖
1. 山東半島城市群項目數據包 UML 類圖
UML 類圖見圖 12 - 8。
2. 成果圖件要素集 UML 類圖
1) 基礎地理要素集實體 UML 類圖 ( FD_Geography) 。本項目將基礎地理要素分為地理網格、居民地、境界、交通網、地貌地形、水系、海洋海岸帶、行政區劃、柵格數據等 9個抽象要素類,建立了 「各市基本情況」對象類,與表明各地區域的 「城市群」類相連接,將山東半島城市群8 個地級市的地理位置數據與地區的基本資料數據有機地聯系起來。
2) 地質要素集實體 UML 類圖 ( FD_Geology) 。
3) 國土資源要素集實體 UML 類圖 ( FD_LandResource) 。
4) 水資源要素集實體 UML 類圖 ( FD_WaterResource) 。
5) 生態環境要素集實體 UML 類圖 ( FD_Environment) 。
6) 輔助要素集實體 UML 類圖 ( FD_Ancillary) 。
3. 山東半島城市群項目數據實體關系圖
1) 數據集實體 ER 圖 ( MGRD_DataSet) 。
2) 研究成果報告數據實體 ER 圖 ( MGRD_SummaryReport) ( 圖 12 - 9) 。
圖 12 -9 研究成果報告數據實體 ER 圖 ( MGRD_SummaryReport)
七、山東半島城市群項目數據包數據字典
( 一) 數據集實體 ( MGRD_DataSet)
山東半島城市群地區地質-生態環境與可持續發展研究
( 二) 研究成果報告數據實體 ( MGRD_SummaryReport)
1. 文字報告數據實體 ( SR_WordReport)
山東半島城市群地區地質-生態環境與可持續發展研究
2. 成果圖件數據實體 ( SR_ThemeMapSet)
( 1) 基礎地理要素集實體 ( FD_Geography)
山東半島城市群地區地質-生態環境與可持續發展研究
( 2) 地質要素集實體 ( FD_Geology)
山東半島城市群地區地質-生態環境與可持續發展研究
( 3) 水資源要素集實體 ( FD_HydroResource)
山東半島城市群地區地質-生態環境與可持續發展研究
『伍』 地質-生態環境空間資料庫建設指南
一、編寫目的
建立山東半島城市群地質-生態環境空間資料庫,是「山東半島城市群地區地質-生態環境綜合調查評價及可持續發展研究」項目的設計要求,而山東半島城市群地質-生態環境空間資料庫建設,涉及地質、環境、水文、礦產等專業,並涉及單位較多,需要提交入庫的數據也較多,為了指導和規范資料庫項目的建設,特編寫本指南,重點從建庫的數據整理與格式轉換階段規范工作流程,明確最終提交成果,同時對元數據的填寫做出了詳細規定,本指南對山東半島城市群空間資料庫建設具有指導作用。
二、適用范圍
本指南適用於山東半島城市群地質-生態環境空間資料庫建設工作。
三、編寫依據及參考標准
1.國家及行業標准
GB/T2260—1999中華人民共和國行政區劃代碼
GB/T17798—1999地球空間數據交換格式
GB/T13923—92國土基礎信息數據分類與代碼
GB/T17766—1999固體礦產資源/儲量分類
GB/T13989—92國家基本比例尺地形圖分幅和編號
GB/T9649—88地質礦產術語分類代碼
GB/T9649.16—1998地質礦產術語分類代碼礦床學
DZ/T0197—1997數字化地質圖圖層及屬性文件格式
2.部門標准
GX199900X-200X國土資源信息高層分類編碼及數據文件命名規則國土資源部省級礦產資源規劃編制指南國
國土資源部礦產資源儲量資料庫標准
中國地質調查局空間資料庫工作指南2.0版
版山東半島城市群地質-生態環境空間資料庫建庫標准(試行稿)
四、資料庫框架設計
1.資料庫需求分析
山東半島城市群資料庫是在「山東半島城市群生態環境地質」項目研究成果的基礎上研製、基於Arcinfo平台的空間資料庫系統,其總體目標是存儲和管理「山東半島城市群生態環境地質」項目研究成果的資料、信息、地圖及提供查詢服務,為山東半島城市群的空間布局管理、規劃和決策以及重大項目建設和經濟社會可持續發展提供依據。為達成這一總體目標,對資料庫建設的需求應該包括以下方面:
1)對項目成果圖件及其他數據存儲管理的需求,需要構建一個符合要求的空間資料庫。
2)提供對山東半島城市群生態環境地質研究成果的管理、查詢與展示。
3)提供山東半島城市群生態、環境的現狀與分級分布情況。
4)組織山東半島城市群生態環境專題圖件,直觀地為決策咨詢提出相應的對策和解決方案。
(1)功能需求
通過需求分析,得到軟體的功能需求。除基本的數據輸入、編輯和管理功能外,本系統還應具有以下4個方面的要求:
1)對現有地質-生態環境問題的展示、查詢;
2)地質-生態環境質量現狀的分析;
3)對地質-生態環境與可持續發展關系的分析評價;
4)保持經濟增長和地質-生態環境相協調的對策與建議。
(2)性能需求
本資料庫系統的性能需求為:
1)系統穩定性好;
2)可擴展性好;
3)操作簡單;
4)可移植性好;
5)保密性。
根據「山東半島城市群地區地質-生態環境綜合調查評價及可持續發展研究」項目需求分析,資料庫涉及的基礎圖件和數據、項目研究的成果數據如下:
1)基礎地理、地質圖件,採用1∶20萬的地理底圖和經過簡化的地質底圖。
2)各專題項目編匯的成果圖件,包括:
山東半島城市群地區地質圖;
山東半島城市群地區衛星遙感影像圖;
山東半島城市群地區區域穩定性綜合評價圖;
山東半島城市群地區土地資源環境質量評價圖;
山東半島城市群地區礦產資源綜合評價圖;
山東半島城市群地區地表水評價圖;
山東半島城市群地區地下水環境評價圖;
山東半島城市群地區海岸帶地質災害分布圖;
山東半島城市群地區生態環境綜合評價圖;
山東半島城市群地區地質災害易發區分布圖;
山東半島城市群地區地質生態與經濟可持續發展對策圖;
煙台地區地殼穩定性評價分區圖;
煙台地區地質-生態環境分析與評價圖;
煙台地區生態功能區劃與生態市建設規劃圖;
青島地區地殼穩定性評價分區圖;
青島地區海岸帶地質環境質量評價圖;
青島地區地質-生態環境評價分區圖。
3)屬性數據;
4)文字報告;
5)專題圖件數據。
2.資料庫系統架構
根據以上對資料庫需求的分析,結合目前項目的需要和經費情況,採用的系統架構見圖12-1。
圖12-1 資料庫系統架構
本項目採用 ArcGIS Desktop 來搭建系統平台,用以實現定義好的空間數據和非空間數據的存儲和管理。系統的核心採用地理資料庫 GeoDataBase 體系結構。在後台通過 ArcCat-alog 應用模塊來組織和管理所有的 GIS 信息,比如地圖、數據集、模型、元數據、服務等; 通過 ArcToolBox 工具來完成數據轉換、疊加處理、地理編碼、統計分析和投影變換等數據處理。
客戶端採用定製的 ArcMap,用以完成數據的顯示、分析和編輯。另外可以通過 Arc-GIS 的擴展模塊來實現對空間數據進行高效率的可視化和分析; 用 ArcGIS Spatial Analyst實現柵格數據的顯示和處理。ArcGIS Desktop 系統平台表現示例見圖 12 -2。
在系統資料庫建成之後,如項目的後期需要進行數據的共享和發布,可採用 ArcSDE +ArcIMS 的搭配來實現 B / S 構架的數據共享。
圖12-2 ArcGIS Desktop系統平台表現示例
3.資料庫系統功能軟體的系統功能分為基本系統數據管理功能和專業應用擴展功能兩大部分。根據需求分析,確定各部分的功能。
1)基本功能部分:包括系統管理,數據輸入、編輯、查詢和輸出,數據處理和圖形符號庫管理等。
2)擴展功能部分:包括現狀展示、分析評價、可持續發展評價和決策支持等。系統的功能模塊構成見圖12-3。
圖12-3 系統的功能模塊構成
4.系統軟體平台
在本項目的研究中,結合調查評價研究項目的工作實際,選取了美國ESRI公司的ArcGIS軟體作為資料庫開發的GIS軟體平台,同時考慮到各專題研究單位的實際情況,選取MapGIS作為電子圖件的繪制軟體。在匯總各專題研究單位提交的MapGIS數字圖件後,進行MapGIS格式數據向ArcGIS格式數據的轉換,將研究成果載入到項目統一的地質-生態環境空間資料庫中。本項目選擇的ArcGIS軟體平台包括ArcGISDesktop、ArcS-DE、ArcIMS等組件。
5.硬體平台選擇
除按系統平台的選擇原則外,硬體選擇從以下方面考慮:
1)硬體的性能:能夠滿足系統軟體平台的運行需求;
2)與其他硬體的兼容性:各種硬體設備可以協同工作;
3)與軟體的兼容性:要兼容操作系統、資料庫軟體或其他應用軟體。
可利用現有的計算機硬體,適當增設需要的硬體來構造系統的硬體環境。
6.系統實現步驟
(1)系統設計
1)總體結構設計:主要指系統中各子系統之間關系的設計。
2)系統各子系統或子功能模塊的描述:各功能模塊要劃分到軟體單元的層次,要求描述清晰,以滿足編碼、編譯和測試的需要。
3)系統外部介面設計:完成系統外部介面、各軟體單元之間的詳細設計。
4)數據結構和資料庫設計:主要指規劃數據組織與表達方式的設計。
5)界面設計:主要指應用系統的操作界面設計。
6)軟、硬體設計:主要指系統軟硬體運行環境的設計。
7)系統單元測試的詳細計劃:包括測試集、測試用例和測試步驟。
(2)軟體編程
完成程序代碼的編寫及資料庫建庫任務。
1)遵照軟體設計說明書的要求,利用編程工具編製程序代碼,並完成程序代碼的測試工作。
2)按照半島城市群項目資料庫標准及資料庫建庫規范的要求,完成數據建庫工作。
(3)系統集成與測試
完成系統集成及測試,生成可實際運行的系統,編寫用戶使用手冊。
1)系統集成。
2)系統集成測試。集成測試的步驟為:
①制定系統各單元、模塊、子系統的集成計劃和集成測試計劃,內容包括測試要求、步驟、數據和時間表等;②編寫系統集成、測試文檔;③按計劃進行系統集成與集成測試,修改錯誤,再測試,直到符合設計要求;④編寫測試報告。
3)編寫用戶使用手冊。
五、數據入庫工作流程
工作流程主要用於對規劃資料庫數據入庫方法和過程進行指導。項目資料庫的數據入庫流程見圖12-4。
圖12-4 數據入庫流程
1.資料收集
主要包括圖件、表格和文字資料等項目所涉及的數據和成果。
2.資料預處理
數據預處理就是在全面收集資料的基礎上,對資料進行系統的分析研究、綜合整理及篩選等。
3.建庫文檔准備
主要是指對建庫所需的文檔進行准備,主要為數據整理記錄表、屬性填卡表准備,MapGIS編圖的花紋符號庫、線型庫、顏色庫設定等。
4.數據採集
數據的採集主要包括圖件的輸入、建立分層文件、屬性的輸入。
5.數據整理
數據整理的主要內容為:檢查數據分層,重新命名分層文件,補充新增圖層、調整部分地理、地質和規劃專題屬性結構,增加部分屬性表格,以及整理附加文檔等,完成上述工作後要填寫元數據採集表並完成對元數據的錄入,最後,對所有文件要進行標准化命名。
6.空間數據格式轉換
按照項目建庫的統一要求,各子項目在MapGIS平台下完成的成果圖件,數據需要向ArcInfo格式進行轉換。
六、數據質量監控
1.質量監控體系
項目承擔單位和實施單位要建立完善的規劃資料庫建設質量監控體系,並制定相應的制度。
(1)自互檢
建立完整的自互檢表,每個作業人員的建庫工作都要進行100%的自檢,並將自檢所發現的問題及時改正。在自檢的基礎上,由項目負責人安排其他作業人員進行60%以上的互檢,並將互檢結果和修改處理結果如實、完整地記錄下來。
(2)抽檢
每張圖完成後,由項目負責抽取10%進行檢查,並確保檢查內容全部符合質量要求。
(3)階段性檢查
對建庫的每個階段性成果要進行嚴格檢查把關,如圖件掃描矢量化後的圖元檢查;屬性錄入後的圖元、屬性一致性檢查等。
2.數據質量監控
(1)空間數據質量檢查
空間數據質量檢查主要是對成果圖上的內容進行質量檢查,要分別對MapGIS和ArcInfo格式的所有圖層進行逐項檢查,包括入庫數據圖層套合精度、拓撲、命名的標准化規范化、分層的正確性、數據的完整性、屬性表結構的正確性、圖元與屬性的對應性、屬性代碼的准確性等。
(2)圖面質量檢查
圖面檢查是指對提交的成果數據圖進行圖面內容檢查,發現錯誤應及時修改完善,直至准確無誤。
(3)數據表數據質量檢查
是指對非空間數據表和空間屬性數據表檢查數據的正確性,檢查數據結構的一致性,並對照規劃文本檢查與規劃實施相關內容的完整性和正確性。
(4)文檔檢查
資料文檔檢查主要是檢查資料庫所要求的文本、研究報告、編制說明、附表等資料文檔是否齊全,內容是否正確,並檢查元數據採集表及入庫數據內容是否合乎要求。
3.數據質量監控指標
上述內容的檢查總錯誤率小於2%,其中,圖元(包括點、線、面、注釋)錯誤率小於1%,屬性(包括文字、代碼、ID號對應、記錄個數等)錯誤率小於2%,凡錯誤率大於該兩值的,或發生圖層缺失、附表缺失、文檔缺失以及未提交正確的元數據採集表和入庫數據的,一律不予通過。
七、提交數據要求
1.提交格式
成果圖件:MapGIS格式,含工程、圖層和系統庫文件。
文檔:包括編制說明、研究報告及其他文檔資料(Word和Html兩種格式)。表格:Access和Excel兩種格式。
元數據採集表:Word格式。
2.提交形式
匯交數據存儲介質為光碟。在提交成果之前,要進行全面查殺毒,確保數據安全。