数据库建设规范
‘壹’ 如何设计合理高效的数据库
一、 引言数据库对于企业信息化的重要性是不言而喻的。数据库存储着现代企业最重要的数据,包括生产、经营、管理等各类数据,这些数据作为企业的核心信息,通过各类信息系统,为用户提供及时准确的信息,帮助用户分析,为用户提供决策依据。为提高企业的工作效率,提升企业形象,具有传统模式无法比拟的优势。其中构建合理高效的数据库,是数据库建设关键之一。如何构建合理高效的数据库是企业信息化过程要解决的问题。下面就数据库的构建谈谈自己的一些经验,希望能对大家有所帮助。 二、 设计数据库之前
数据库并不是凭空想象出来的,而是根据业务部门的需要设计符合业务需求的数据库。因此在形成数据库之前需要充分了解业务需求。 1. 充分理解业务需求。需求分析是整个设计过程的基础,是最困难、最耗费时间的一步。在这期间通过与业务部门交流,了解用户的想法以及工作流程,通过双方多次交流,会形成初步的数据模型,当然这时的数据模型不会是最终的模型,还需要和用户进行交流,并且在以后的信息系统开发过程中还会反复修改。 2. 重视输入输出。在定义数据库表和字段需求(输入)时,首先应了解数据产生源和数据流程,也就是必需要知道每个数据在那儿产生,数据在那儿表现,以什么样的形式表现等等,然后根据用户提供的报表或者设计出的报表、查询和视图(输出)以决定为了支持这些输出哪些是必要的表和字段。 3. 创建数据字典和ER 图表。ER 图表和数据字典可以让任何了解数据库的人都明确如何从数据库中获得数据。ER图对表明表之间关系很有用,而数据字典则说明了每个字段的用途以及任何可能存在的别名。对SQL 表达式的文档化来说这是完全必要的。 需要注意的是,在需求分析调研过程中,并不是一帆风顺的,因为业务人员对于业务的理解不同,以及对于信息知识的缺乏,会影响需求分析的质量,为了提高质量,各方要用更多的时间交流与相互理解,业务部门需要精通业务的人员自始至终全力配合,而开发人员则尽量使用用户理解的业务术语交流,这样会避免出现理解不同而产生的歧义。 三、 设计合理的表结构
通常合理的表结构会减少数据冗余,提高数据库的性能。设计合理的表结构要遵循以下两点。 1. 标准化和规范化 数据的标准化有助于消除数据库中的数据冗余。标准化有好几种形式,但3NF(第三范式)通常被认为在性能、扩展性和数据完整性方面达到了最好平衡。简单来说,遵守3NF标准的数据库的表设计原则是:某个表只包括其本身基本的属性,当不是它们本身所具有的属性时需进行分解。表之间的关系通过外键相连接。它具有以下特点:有一组表专门存放通过键连接起来的关联数据。 例如:某个存放单井信息及其有关油井生产日报信息的3NF数据库就有两个表:单井基础信息和油井日报信息。日报信息不包含单井的任何信息,但表内会存放一个键值,该键指向单井基础信息里包含该油井信息的那一行。 不过也有例外,有时为了效率的缘故,对表不进行标准化也是必要的。 2. 考虑各种变化 在设计数据库的时候考虑到哪些数据字段将来可能会发生变更。使数据库更具扩展性,从而减少将来数据变更所带来的损失。 例如,日期类型字段,有时我们会考虑使用字符类型代替日期类型,因为在处理日期字段上容易产生数据错误,所以我们就使用字符类型。这样的例子还很多,在做前期设计时都要考虑的。 表结构的设计不是一次就能成功的,在信息系统开发过程中会存在数据读取、录入或统计困难,为了解决这些问题会修改表结构,或增加一些字段,或修改一些字段的属性。这个过程不断重复,因此不要想一次能成功。建议使用专门设计工具来做这些工作,笔者经常使用:SYBASE PowerDesigner ,当然还有其它的工具:ORACLE Designer 2000 ,ROSE等工具。这样会使你的工作事半功倍。 四、 选择合理的索引
索引是从数据库中获取数据的最高效方式之一。95%的数据库性能问题都可以采用索引技术得到解决。 1. 逻辑主键使用唯一的成组索引,对系统键(作为存储过程)采用唯一的非成组索引,对任何外键列采用非成组索引。考虑数据库的空间有多大,表如何进行访问,还有这些访问是否主要用作读写。 2. 大多数数据库都索引自动创建的主键字段,但是可别忘了索引外键,它们也是经常使用的键,比如运行查询显示主表和所有关联表的某条记录就用得上。 3. 不要索引大型字段(有很多字符),这样作会让索引占用太多的存储空间。如MEMO(备注)、TEXT(文本)等字段。 4. 不要索引常用的小型表 不要为小型数据表设置任何键,假如它们经常有插入和删除操作就更别这样作了。对这些插入和删除操作的索引维护可能比扫描表空间消耗更多的时间。如代码表,或系统参数表。 五、 保证数据完整性
数据的完整性非常重要,这关系到数据的准确性,不准确的数据是毫无价值的,因此保证数据的完整性非常重要。 1. 完整性实现机制:实体完整性:主键参照完整性: 父表中删除数据:级联删除;受限删除;置空值父表中插入数据:受限插入;递归插入 父表中更新数据:级联更新;受限更新;置空值 DBMS对参照完整性可以有两种方法实现:外键实现机制(约束规则)和触发器实现机制用户定义完整性:NOT NULL;CHECK;触发器 以上完整性机制需要熟悉和掌握,它对于数据的完整性非常重要。 2. 用约束而非业务规则强制数据完整性 采用数据库系统实现数据的完整性。这不但包括通过标准化实现的完整性而且还包括数据的功能性。在写数据的时候还可以增加触发器来保证数据的正确性。不要依赖于业务层保证数据完整性;它不能保证表之间(外键)的完整性所以不能强加于其他完整性规则之上。 3. 强制指示完整性 在有害数据进入数据库之前将其剔除。激活数据库系统的指示完整性特性。这样可以保持数据的清洁而能迫使开发人员投入更多的时间处理错误条件。 4. 使用查找控制数据完整性 控制数据完整性的最佳方式就是限制用户的录入。只要有可能都应该提供给用户一个清晰的价值列表供其选择。这样将减少键入代码的错误和误解同时提供数据的一致性。某些公共数据特别适合查找:性别代码、单位代码等。 5. 采用视图 视图是一个虚拟表,其内容由SQL语句定义,视图不仅可以简化用户对数据的理解,也可以简化他们的操作。那些被经常使用的查询可以被定义为视图,从而使得用户不必为以后的操作每次指定全部的条件。另外通过视图用户只能查询和修改他们所能见到的数据。数据库中的其它数据则既看不见也取不到。数据库授权命令可以使每个用户对数据库的检索限制到特定的数据库对象上,增强数据的安全性。 六、 结束语
数据库的高效运行不仅需要技术上的支持,也需要硬件平台和网络的支持以及数据库管理员的有效管理,本文只是从技术的角度说明如何提高数据库的效率,但在实际应用过程中其它方面的支持也是不可缺少的,尤其是数据库管理,数据库建设是“三分技术,七分管理,十二分基础数据”,因此对于数据库管理一定要重视,在管理到位的情况下技术才能发挥应有的作用。
‘贰’ 数据标准
为确保系统各数据库与各功能模块之间的数据分类、编码及数据文件命名的系统性和唯一性,满足系统正常高效运行以及与其他相关系统协同运作的要求,实现系统之间相互兼容、信息共享,数据库建设时必须遵循有关的标准规范。需参照的标准规范如下:
GB/T2260—98 中华人民共和国行政区划代码
GB/T2808—81 全数字式日期表示法
GB/T9649—88 地质矿产术语分类代码
GB/T13923—92 国土基础信息数据分类代码
DZ/T0001—91 区域地质调查总则(1:50000)
DZ/T0157—95 1:50000地质图地理底图编绘规范
DZ/T0160—95 1:200000地质图地理底图编绘规范及图式
DDB9702 GIS图层描述数据内容标准
地质图空间数据库建设工作指南 中国地质调查局
DDZ9701 资源评价工作中地理信息系统工作细则
DZ/T 0179—1997 地质图用色标准及用色原则
DD2005—01 多目标区域地球化学调查规范(1:25万)中国地质调查局
DD2005—02 区域生态地球化学评价技术要求 中国地质调查局
DD2005—03 生态地球化学评价样品分析技术要求 中国地质调查局
GB/T17296—2000 中国土壤分类与代码
GB/T13989—92 国家基本比例尺地形图分幅编号
DZ/T0167—1995 区域地球化学勘查规范(1:200000)
GB/T18507—2001 城镇土地分等定级规程
GB/T17296—2000 中国土壤分类代码
‘叁’ 分等数据库的建设
(一)农用地分等数据的组成
农用地分等数据成果丰富,按照农用地分等的流程可分为自然质量分、自然质量等指数、自然质量等别、土地利用系数、土地经济系数、利用等指数、利用等别、经济等指数和经济等别;按照农用地分等数据的性质可分为空间数据、属性数据、文本数据。为使农用地分等成果能够方便、直观地展现国家级、省级、县级、乡级各级农用地的质量与数量特征,实现对农用地分等数据的查询、分析、融合、分发等功能,必须建立一套统一、规范化的数据管理体系。这套体系能够从农用地分等的基础资料、中间成果和农用地分等成果(图、文、表)等海量数据中提取信息,供汇总平衡、调整、分析,为各级政府部门制定相关政策提供技术支持,是土地信息化的坚实基础,对各级农用地的数据(包括属性数据和矢量数据)进行更新、查询、检索和集成,建设农用地分等数据库。
农用地分等数据库的建设是实现土地资源数量、质量、产能与生态环境并重管理及国土信息化工程建设的基础保障,是实现国土资源现代化管理、社会化服务的必要前提,也是各级政府和国土资源管理部门切实保护基本农田、实施耕地占补按等级折算的重要手段。广西壮族自治区农用地分等自治区级与县级农用地分等成果主要包括文字成果、图件成果、数据成果和电子成果。
1.文字成果
文字成果主要包括自治区级与县级农用地分等技术报告(包含县级农用地分等基础资料汇编等)。农用地分等技术报告主要包括4个方面的内容:一是分等对象所在区域的自然、经济和社会概况;二是分等技术方法,包括分等参数的确定,分等因素指标区、分等单元、土地利用系数等值区与土地经济系数等值区的划分方法,分等因素及其分值和权重的确定方法,等别划分方法,分等成果检验与调整方法,计算机技术在分等中的应用以及其他需要说明的技术问题等;三是分等成果及其分布特点和规律、地域组合特点、差异原因、农用地利用中存在的主要问题等;四是分等成果的应用分析。
2.图件成果
图件成果具体包括分等单元图、农用地自然质量等别分布图、农用地利用等别分布图、农用地经济等别分布图、标准样地分布图。
3.数据成果
数据成果包括广西壮族自治区的农用地分等单元原始属性数据表、样点投入产出调查数据表、农用地分等基本参数表、各指标区“指定作物-分等因素-自然质量分”记分规则表、农用地分等各指标区分等因素体系及其权重表、土地利用系数与土地经济系数汇总表、土地利用系数等值区间表、土地经济系数等值区间表、自治区级农用地分等单元指定作物计算结果表、自治区级农用地分等单元多作物综合计算结果表、农用地分等结果各乡(镇)面积汇总表、农用地分等结果各地类面积汇总表、自治区级农用地分等单元综合数据表、农用地标准样地属性数据表等,部分表格见附录。
4.电子成果
广西壮族自治区农用地分等电子成果用光盘或硬盘保存,提交的农用地分等成果包括文字、图件和数据等成果的电子版本。
(二)农用地分等数据库建设的依据与内容
1.农用地分等数据库建设的依据
农用地分等数据库建设首先要依据分等数据的特点:一是信息量巨大;二是数据与信息种类多种多样,按数据的特征分为属性数据和矢量数据,按数据的来源和性质分为农用地自然属性和社会经济属性,这些数据涉及土地学、农业学、地理学、测绘学、信息学和经济学等众多学科;三是成果具有复杂多层次的特征。其次,依据《农用地分等数据库标准》,农用地分等成果数据的内涵、特点及其应用需求,设计农用地分等数据库建设方案,按照《农用地分等规程》对农用地分等的各个环节及其成果数据进行整合加工标准化处理,把农用地分等成果的矢量数据和属性数据,通过关联式数据系统储存、管理、整合在一起,建立统一、规范的农用地分等数据库。
2.农用地分等数据库建设的内容
农用地分等数据库建设的内容主要包括农用地分等数据的分类编码、农用地分等数据的图形要素分层、农用地分等数据的属性数据结构、分等单元扩展属性结构、外部表格信息和农用地分等数据文件命名6个方面的内容。
农用地分等数据的分类编码包括基础地理信息分类与编码、土地利用信息分类与编码和分等基础信息分类与编码。
农用地分等数据的属性数据结构内容复杂,主要包括基础地理、土地利用类图层属性表、注记属性表结构、县级分等基础层属性表结构、县级分等结果层属性表结构、自治区级分等基础层属性表结构、自治区级分等结果层属性表结构等内容。
分等单元扩展属性结构包括指定作物分等计算结果表结构和县级综合等别计算表结构。
外部表格信息包括指定作物参数表结构、“指定作物-分等因素-分值”说明表结构、“指定作物-分等因素-权重”说明表结构、标准样地属性特征基准分值表结构、“县级-自治区级”农用地分等单元对应表结构、县级文档结果和自治区级文档结果。
农用地分等数据文件命名规则包括以行政区为基础的数据文件命名规则和文档数据文件命名规则等内容。
(三)数据库系统的设计思想和目标
广西壮族自治区农用地分等数据管理信息系统的设计思想是以地理信息系统(GIS)为平台,在计算机软硬件支持下,把各种地理信息按照空间分布,以一定的格式输入、存储、检索、更新、显示、制图和综合分析的计算机技术系统。利用该系统,通过对农用地诸多因素(自然因素和社会经济因素)的综合分析,找出农用地变化的特点与规律,从而迅速地获取满足应用需要的信息,并能以地图、图形或数据的形式表示处理的结果。
1.系统的设计思想和目标
广西壮族自治区农用地分等数据管理信息系统的设计是在充分研究和总结土地利用管理的实际工作需求和吸收目前计算机技术在土地管理中的应用经验的基础上,结合国土资源部新一轮国土资源大调查中《县级土地利用数据库标准》和《县(市)级土地利用数据库建设技术规范(征求意见稿)》而制定的。系统的设计综合了以下几方面的技术:①数字制图技术;②计算机的自动查询、检索分类、计算统计技术;③空间查询和分析技术;④空间信息的存储管理技术;⑤计算机网络技术。配套统一以上技术,将地理信息系统(GIS)技术应用到系统的设计中,形成系统基本的设计思想,即按照农用地分等数据的规范和标准,建立起农用地分等数据管理的技术路线和工艺流程,按照GIS的要求严格控制入库数据的精度;提供方便、快捷的实用工具,提高数据库的利用率和满足国土资源管理部门的工作需求;利用地理信息系统中的空间分析功能,完成对数据库的动态更新,维持数据库的现势性。
广西壮族自治区农用地分等数据管理信息系统设计的基本目标是满足国土资源管理部门对农用地分等数据的管理需求,提高土地管理的效率和质量,并且充分利用计算机技术来减轻土地管理工作的劳动强度,最终实现土地管理的信息化,构建“数字国土”工程的基础设施。
2.数据入库
数据入库前要检查采集数据的质量,检查合格的数据方可入库。数据检查主要包括矢量数据几何精度和拓扑检查、属性数据完整性和正确性检查、图形和属性数据一致性检查、接边精度和完整性检查等。数据入库主要包括矢量数据、DEM数据、DOM数据、元数据等数据的入库。最后进行系统测试(图3-17)。
图3-17 入库工作流程图
数据入库前要对采集数据进行全面质量检查,并对错误进行改正,数据的检查与更正是数据建库中至关重要的一步。
(1)按照《县级土地利用数据库标准》、《农用地分等规程》等相关标准确定检查项,包括矢量数据几何精度和拓扑检查、属性数据完整性和正确性检查、图形和属性数据一致性检查、接
边完整性检查等。
(2)基于上述检查项,定制检查内容,配置相应的参数。
(3)按照定制的内容,系统自动实现批量检查,也可以采用人机交互方式对重点内容进行检查,对发现的错误及时修正。
(4)自动生成或手工编写检查报告,检查与更正工作结束(图3-18)。
图3-18 数据检查流程图
1)矢量数据入库
(1)数据检查。数据入库前,对矢量数据质量进行全面检查,并记录检查结果,对质量不合格的数据应予以返工,质量检查合格的数据方可入库。
(2)参数输入及其数据组织入库。依据参数设置的要求,向数据库管理系统中输入各种建库参数,对不同数据层的数据建立索引等,各要素数据可分层入库,也可批量入库。
(3)多尺度空间数据连接设置。对于多尺度空间数据库应设置连接参数,便于不同比例尺数据的显示。
2)元数据入库
利用数据库管理软件,采用人工和自动相结合的方法对各要素元数据内容进行检查和处理,导入各种元数据。
3)属性入库
利用Excel软件输入分等评价单元质量分值表,形成分等评价单元自然属性电子表格文件;再将各评价单元的土地利用系数和土地经济系数进行汇总,划分各等值区;然后,汇总到分等评价单元自然属性表中,计算农用地分等单元的自然质量等指数、利用等指数和经济等指数;利用相关软件将整个Excel总表转换到数据库中,存为DBASE格式文件;最后,根据关键属性字段挂接,使图、表合一,形成统一的空间数据库。
4)系统运行情况
数据入库完成后,对系统进行全面的测试;并对测试出现的问题进行全面分析和处理。
具体测试内容及要求为系统运行无死机现象;系统能对数据库中数据层进行组合查询,且数据结构正确;系统能够对数据进行汇总统计并输出相关表格成果;系统能按要求输出相关图件,等等。
(四)系统设计总体框架图
广西壮族自治区农用地分等评价数据管理系统横向包括农用地调查评价基础业务工作,纵向涵盖国家、省、市、县四级国土资源管理部门,其总体框架如图3-19和图3-20。
图3-19 总体框架横向结构图
图3-20 总体框架纵向结构图
(五)数据库系统功能的实现
依据农用地分等成果和土地利用管理的需求,该系统应具有以下基本功能:
1.系统建库
系统建库是指把农用地分等成果及其涉及的信息用计算机存储起来,它具有两个方面的含义:一是全面进行数字化建库,采用MapGIS的数据结构和几何特征的描述术语,输入农用地分等数据;还可在已有的图形数据库的基础上进行建库,可利用MapGIS平台提供的数据转换和属性管理工具把图形和属性转换到系统中来;二是变更数据,根据农用地分等进展情况,及时更新农用地分等数据信息系统。
2.数据查询和检索
数据查询和检索模块是系统的主要功能模块。该系统提供了强大的地图浏览、图层控制、空间索引、查询统计、空间分析和报表输出等功能,为实现统筹数量、质量与生态并重管理,建设资源节约型社会提供了良好的手段;同时,也满足公众参与管理农用地分等数据的功能,加大土地科学普及工作,树立全社会关注农用地资源安全、耕地保护与国家粮食安全的意识;通过模糊查询、条件查询、空间查找等具体功能可以快速查询村、国家级基本农田、地类图斑等重要对象的空间位置和属性信息;能对县(市、区)各级数据进行实时动态的统计汇总,并可用专题图的形式对不同区域的农用地分等数据按不同的指标进行对比分析,可以输出各种图形和报表;可以根据不同的业务需要,设计不同的数据应用分析模型,例如征地分析模型、土地开发整理前后质量评价模型、土地利用变化模型等。通过系统,按这些模型进行处理,输出分析结果,从而有效地促进国土资源管理工作的信息化、科学化、专业化,提高办事效率,避免决策失误。
3.成果输出
依据农用地分等制图规范和土地利用管理需求,输出农用地分等图形和数据成果;还可以按行政区域及任意区域裁剪图件等。
4.系统维护
该系统是按照国家的有关规程和标准进行设计的,可根据土地管理实际情况做进一步的编码和更新,满足国土资源管理工作的实际需要。
‘肆’ 地质-生态环境空间数据库建库标准
一、范围
本标准定义了山东半岛城市群地质-生态环境空间数据库的数据结构框架、数据实体及实体之间的相互关系,定义了成果图件空间数据的要素集、要素类、要素分类代码及属性数据项,可用于山东半岛城市群项目数据的采集、存储、管理、共享及数据库建设。
二、规范性引用文件
下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。
GB / T 1. 1—2000 标准化工作导则 第 1 部分: 标准的结构和编写规则
GB / T 13923—92 国土基础信息数据分类代码
GB / T 2260—1999 中华人民共和国行政区划代码
GB / T 2659 世界各国和地区名称代码
GB / T 9649—88 地质矿产术语分类代码
DZ / T 0160—95 1∶ 200000 地质图地理底图编绘规范及图式
DZ / T 0197—1997 数字化地质图图层及属性文件格式
GB 958—99 区域地质图图例 ( 1∶ 50000)
DZ / T 0179—1997 地质图用色标准及用色原则
DDB 9702 GIS 图层描述数据内容标准
GB 17108—1997 海洋功能区划技术导则
中国地质调查局 地质图空间数据库建设工作指南 ( 2. 0 版)
中国地质调查局 1∶ 20 万区域水文地质图空间数据库图层及属性文件格式工作指南
三、术语和定义
本标准涉及的主要术语如下:
1. 地理信息数据库 ( geodatabase)
采用标准关系数据库技术来管理、表现地理信息的空间数据库。
2. 数据包 ( data package)
逻辑相关数据实体的集合,本标准中将山东半岛城市群项目数据整体视作一个数据包。
3. 数据实体 ( data entity)
描述专业领域同一类型数据的数据元素的集合,如地质构造数据实体,概念上等同于UML 的类。数据实体可通过一个或多个相关的数据元素及相关的数据实体定义。
4. 数据集 ( dataset)
逻辑相关数据组成的数据集合,如一幅地图可视作一个数据集,数据集是一个逻辑上的整体。
5. 数据子集 ( subdataset)
按一定规则划分的数据集中逻辑相关数据的集合,本标准中的一个数据子集对应一个地图要素类,数据子集类别对应地图上的图层划分。
6. 空间数据 ( spatial data)
用来表示空间实体的位置、形状、大小和分布特征诸方面信息的数据。空间数据不仅具有实体本身的空间位置及形态信息,而且还有实体属性和空间关系 ( 如拓扑关系)信息。
7. 空间参照系 ( spatial reference)
对地理信息数据的空间范围和投影的描述。
8. 地图 ( map)
地理信息的图形描述,包括地理信息数据和地图元素,如标题、图例和比例尺等。本标准中将一幅地图视作一个数据集进行管理,并通过一组要素集 ( 要素类、关系类、属性表的集合) 、空间参照系、地图样式定义地图的数据内容及显示方式。
9. 图层 ( layer)
地图上特定区域范围内按一定规则划分的相似要素类的集合,如水系、城镇。图层为要素类的专题组合及表现,一个图层定义了它包含地理信息数据的地理位置和显示方法。
10. 要素 ( feature)
现实世界中的对象在地图图层中的表示,如地图中表示道路的一条线。
……
四、缩略语和符号
1. 缩略语
ARD 图外整饰要素 ( Elements Around Map)
BMAP 地理底图 ( Basemap)
BOU 境界、边界 ( Bourn)
CD 代码 ( Code)
COL 综合柱状图 ( Colomnar Chart)
DT 日期 ( Date)
ELE 地形高程 ( Elevation)
……
2. UML 类图符号
山东半岛城市群地区地质-生态环境与可持续发展研究
3. ER 图符号
山东半岛城市群地区地质-生态环境与可持续发展研究
五、基于 UML 的 Geodatabase 的空间数据模型
构建地质数据的空间数据模型是建立地质信息数据库的一项关键工作,是数据库建设的基础。Geodatabase 数据模型作为 ArcGIS 软件平台的一种通用数据形式,目前已被国内外众多地质空间数据库的建设所采用。数据建模也已经成为地质数据库建立的一项主要内容。
目前针对地质、水文、矿产、海洋等多个领域的专业 Geodatabase 数据模型都已存在,国内目前应用于区域地质 - 生态环境调查的综合地质 - 生态环境空间数据模型还比较少见。因此,本项目在分析国内外目前比较通用的各专业数据模型的基础上,提出了专门面向山东半岛城市群地质 - 生态环境空间数据库建设的 Geodatabase 数据模型。
在 Geodatabase 数据模型中,允许定义要素之间类型的关联,Geodatabase 对空间数据管理以关系数据库为基础,利用商用关系数据库成熟的数据处理能力对空间数据和非空间数据进行统一管理。Geodatabase 使用面向对象的方法,使得要素可以具有自己的行为和属性,并且要素类具有继承性、多态性和封装性。这样,以更加适合自然的行为和人的思维方式去组织数据,更精确地模拟真实世界。
1. Geodatabase 数据模型的结构体系
Geodatabase 数据模型作为一种新型的面向对象的数据模型,融入了面向对象的核心技术,如类 ( Class) 、对象 ( Object) 、封装 ( Encapsulation) 、继承 ( Inheritance) 和多态( Polymorphism) 等思想和技术。Geodatabase 数据模型的目的就是为了让用户能更容易、更自然地表示 GIS 数据特征和更容易地建立特征之间的各种关系。Geodatabase 空间数据库数据模型如表 12 -1 所示。
表 12 -1 Geodatabase 内部结构
续表
2. Geodatabase 数据库模型的特点
Geodatabase 有两种,即个人与多用户 Geodatabase。
1) 个人 Geodatabase 支持内置于 ArcGIS 系统并提供对本地数据的访问,适用于面向项目的 GIS,在 Microsoft Access 数据库平台上实现,提供生成和更新 Access 数据库的服务,可处理小型或适中的 Access 数据库。但个人 Geodatabase 的存储容量有不能超过 2GB的限制。
2) 多用户的 Geodatabase 是通过 ArcSDE ( ARC 空间数据库引擎) 实现的。ArcSDE可以生成和访问从小型到大型的 Geodatabase 并提供关系型数据的开放界面。
与标准的关系数据库相比,Geodatabase 简化了地理数据建模的工作,因为它包含有用于建模地理信息的通用模型。
此外,Geodatabase 还同时支持两个视图,即对象视图和关系视图。这样就综合了对象视图和关系视图两者的优点。对象视图在 Geodatabase 中占据主导地位,其目的是提供一个接近于逻辑数据模型的数据模型,因而更接近于现实。关系视图则用于一些 Geodata-base 数据的常规处理,它表示的是一些简单地理对象的特征。
3. 基于 UML 的 Geodatabase 数据模型的设计
( 1) Geodatabase 数据库设计的方法
在 ArcGIS 中,建立地理数据库可以有多种方法。借助 ArcCatalog,可以通过 3 种方式建立新的地理数据库。
第一种方法是建立一个新的地理数据库。
第二种方法是移植已经存在的数据到地理数据库中去。
第三种方式是用 CASE 工具来建立地理数据库。
( 2) 面向对象和 UML ( 统一建模语言)
面向对象是软件程序设计中的一种新思想,它能使程序设计更加贴近现实,并且花费更小的精力。面向对象方法学包含了对象 ( object) 、类 ( classification) 、继承 ( inherit-ance) 、聚集和消息 ( messages) 的概念。
UML ( Unified Modeling Language,统一建模语言) 是一种基于面向对象方法的建模语言,具有创建系统的静态结构和动态行为等多种结构模型的能力,是一种通用的建模语言。在 Geodatabase 的设计中,主要用到描述系统静态结构的类图。类图的节点表示系统中的类及其属性和操作。类图的边表示类之间的联系,包括继承、关联、依赖、聚合等。
类的表示由 3 个部分方框组成,上面部分给出了类的名称; 中间部分给出了该类的单个对象的属性; 下面部分给出了一些可以应用到这些对象的操作。类的表示如图 12 -5。
图 12 -5 类的表示
关联是对类的实例之间联系的命名,与关联有关的内容有关联元数 ( Degree) 、关联角色 ( Role) 和重复度 ( Multiplicity) 。
UML 中有 3 种类型的类: 抽象类 ( abstract class) 、可创建化类 ( creatable class) 和可实例化类 ( instantiable class) 。
UML 类图的符号见本节第四部分内容。
( 3) 面向对象的地理数据模型的设计方法
利用 CASE 工具进行 Geodatabase 数据模型设计的步骤具体为:
1) 在 CASE 工具中进行 UML 建模。
2) 将设计好的 UML 模型载入资料库 ( repositry) 。
3) 利用 GIS 软件提供的 CASE 接口,根据资料库中的 UML 模型生成空间数据库结构。至此,Geodatabase 空间数据库结构初具雏形。在 GIS 软件环境中,现在可以将新生成的数据或已有的数据进行格式转换后载入到设计好的 Geodatabase 空间数据库中,由空间数据库统一管理。利用 CASE 工具来建立 Geodatabase 地理数据库的工作流程见图12 - 6。
图 12 -6 利用 CASE 工具来建立 Geodatabase 地理数据库的工作流程
六、地质 - 生态环境 Geodatabase 数据模型的建立
( 一) 数据模型设计的依据
根据山东半岛城市群地质 - 生态环境调查评价研究工作的需要和山东半岛城市群地质 - 生态环境 GIS 数据库系统的整体设计要求,结合各地质 - 生态环境要素的成果图件和文本报告资料,利用 UML 设计工具 Microsoft Visio 完成了山东半岛城市群地质 - 生态环境Geodatabase 数据模型的设计 ( 图 12 - 7) 。
图 12 -7 山东半岛城市群地质 - 生态环境 Geodatabase 数据模型的设计依据
( 二) 山东半岛城市群地质 - 生态环境数据库的 UML 类图
1. 数据集管理
山东半岛城市群项目数据包中的数据以数据集为单元统一组织管理,数据集管理方式就是将一份文字报告或一幅成果图件视作逻辑上的整体,用 “数据集编号”唯一标识,通过数据集实体统一管理。同一数据集的不同实体,例如成果图中的图层,通过实体中的“数据集编号”元素关联。
2. 空间数据管理
山东半岛城市群项目数据包由文字报告及成果图件两大类数据组成,并以成果图件为主,成果图件是一空间数据实体,统一存储在面向对象的地理信息数据库中,以图幅为单元进行管理。
3. 数据包总体结构
本标准中山东半岛城市群项目数据包总体结构用 UML 模型来体现,山东半岛城市群项目数据包由 “成果报告”、“元数据”及 “存档文件”3 个数据实体 ( UML 类) 组成,通过 “数据集”实体统一组织管理。“成果报告”由它的继承类 “文字报告”及 “成果图件”定义,为研究成果数据包的主体数据。“元数据”及 “存档文件”为数据集的辅助数据,“元数据”存放文字报告或成果图件的元数据; “存档文件”存放文字报告或成果图件的相关存档文件,供数据集数据的整体下载与利用。
一个 “数据集”实体对应一个项目的 “文字报告”或一幅 “成果图件”; 每一个数据集必须有一个而且只能有一个 “元数据”文件; “存档文件”是 “数据集”的可选聚合实体。
“成果图件”是一空间数据实体,由特定的面向对象地理信息数据库 ( Geodatabase)统一存储、管理。一幅 “成果图件”数据内容由一组空间要素集 ( 基础地理要素集、地质要素集、地球物理要素集、地球化学要素集、辅助要素集) 组成,空间要素集数据类型包括矢量 ( Feature Dataset,简称要素集) 、栅格 ( Raster Dataset) 和 TIN ( TIN Dataset)3 种。
4. 数据集编号的编码规则
数据集编号由数据库管理方统一编码,必须保证编号在数据库中唯一,编号中的英文字母全部大写。
山东半岛城市群项目数据集按 “项目或图幅—提交单位—提交年份—成果序号”编码。数据集编号的字符串长度不得超过 22 位,以保证 “数据集编号 + 要素类名”的字符串总长度不超过 30 位。
5. 成果图件要素类命名规则
要素类名字符串总长度不得超过 8 位。
矢量要素类按 “要素集类型 + 要素类名 + 要素类型”命名,全部用大写英文字母表示。“要素集类型”用一位代码表示,如 “L”表示基础地理要素集。栅格数据集数据以“要素集类型 + 要素类型”命名,要素类型用代码 RAS 表示,如 “DRSRAS”表示遥感栅格数据。TIN 数据集数据以 “要素集类型 + 要素类型”命名,要素类型用代码 TIN 表示,如 “LELETIN”表示地面高程 TIN。
6. 成果图件要素分类编码规则
要素分类编码用以标识不同的要素类要素,保证地图要素存储、交换、显示的一致性。
( 1) 分类编码原则
1) 科学性、系统性;
2) 相对稳定性;
3) 不受地图比例尺的限制;
4) 完整性和可扩展性;
5) 适用性。
( 2) 分类编码方法
成果图件要素类中不同要素的分类编码采用中华人民共和国国家标准 《国土基础信息数据分类与代码》的编码结构,结构如下:
山东半岛城市群地区地质-生态环境与可持续发展研究
大类码、小类码、一级代码和二级代码分别用数字顺序排列。识别位由用户自行定义,以便于扩充。在本项目中编码分两类: ①基础地理要素编码; ②地质专业要素编码( 地质、地球物理、地球化学等) 。
( 三) 山东半岛城市群项目数据实体及实体关系
山东半岛城市群项目数据实体类及其代码见表 12 -2,实体类名代码按实体类的英文名缩略语编码,本标准中山东半岛城市群项目数据实体及实体间关系用 UML 及实体关系图 ( ERD) 来体现。
表 12 -2 山东半岛城市群项目数据实体类及其代码
1. 数据集实体 ( MGRD_Dataset)
山东半岛城市群项目数据包中的 “数据集”实体用来统一组织管理 “文字报告”、“成果图件”、“元数据”及 “存档文件”数据实体,“数据集”实体中的数据项包含数据集的归属项目、提交日期、提交单位、主题类别及地理范围等可用于数据集检索的信息。一个 “数据集”实体对应一个项目的 “文字报告”或一幅 “成果图件”,“数据集”实体与 “元数据”实体间为一一对应关系,与 “存档文件”实体间为一对多的对应关系。“数据集”实体的数据内容及其存储表通过 “数据子集”实体分类定义,主键 [数据集编号]可用于同一数据集中不同 “数据子集”的关联,也可用于数据集对应的 “元数据”及“存档文件”的关联。
2. 成果报告数据实体 ( MGRD SumTmaryReport)
研究成果报告数据实体包括项目的最终综合文字报告及相应的成果图件。
( 1) 文字报告数据实体 ( SR_WordReport)
文字报告数据实体包括 “文字报告”及图像格式的 “报告附图”数据实体,文字报告及附图均以二进制大对象存储。数据实体之间通过 [数据集编号] 关联。
( 2) 成果图件数据实体 ( SR_hemeMapSet)
“成果图件”数据实体是一空间数据实体,主要以矢量图形格式存储在地理信息数据库中,其中也包括栅格数据及 TIN 数据用于数据的空间分析。
1) 要素集: “成果图件” 数据实体以图幅为数据集单元进行管理; 图幅内容以分属不同空间要素集 ( 基础地理要素集、地质要素集、地球物理要素集、地球化学要素集、辅助要素集) 的要素类组合,同一个要素集内的要素类享有同一空间参照系,相互具有拓扑关系。
2) 要素类: 一个要素类的存储单元为关系数据库中的一个数据表,要素类图元类型有点、线、面、注记 4 种,一个要素类只能包含一种图元类型。本标准中基础地理要素集、地质要素集、地球物理要素集、地球化学要素类、辅助要素集的要素类用 UML 类图体现。
3) 图层: 图层为要素类的专题组合及表现,不同图层的组合即构成了可视化 “成果图件”。本项目通过对数据来源的分析,提出并建立了适合山东半岛城市群地区地质 - 生态环境调查与评价特点的空间数据库数据图层。考虑到空间数据的应用和相互转换,每一图层均应建立相应的内部属性表,属性表必须包含一些基本字段内容,根据具体任务的不同,需灵活扩充内部属性表字段内容。 “成果图件”数据实体的图层划分及其代码见表 12 -3。
4) 要素类属性: 要素类的要素特征由属性表定义,属性表每一行对应一个要素,每一列包含要素的一个特征信息。
表 12 -3 成果图件数据实体的图层划分及其代码
5) 要素类要素分类: 同一要素类中不同类型的要素用不同的代码标识,通过属性表中的 “编码” ( GEO_CODE) 数据项体现,以便地图中同一要素类要素的分类显示,并保证地图要素存储、交换、显示的一致性。在本项目中成果图件的基础地理要素分类代码采用中华人民共和国国家标准 《国土基础信息数据分类与代码》,并根据需要进行了扩充,地质专业要素分类代码全部由本标准定义,见表 12 -4 和表 12 -5。
表 12 -4 基础地理要素分类代码
表 12 -5 地质专业要素分类代码
图12 -8 山东半岛城市群项目数据包UML类图
图层编码中,第一位为图类代码,L 代表基础地理类图层; D 代表基础地质类图层;G 代表国土资源图层; W 代表地壳稳定性图层; S 代表水资源图层; H 代表海岸带图层;T 代表生态环境图层; R 代表人类工程活动图层; F 代表分析评价图层; Y 代表预测与防治图层; Z 代表辅助图层。第二位为比例尺代码,图件均采用 1∶ 50 万比例尺,代码为 B。第三位到第五位为图名的汉语拼音首字母缩写。第六位为图层数字编号。
( 四) 山东半岛城市群项目 UML 类图
1. 山东半岛城市群项目数据包 UML 类图
UML 类图见图 12 - 8。
2. 成果图件要素集 UML 类图
1) 基础地理要素集实体 UML 类图 ( FD_Geography) 。本项目将基础地理要素分为地理网格、居民地、境界、交通网、地貌地形、水系、海洋海岸带、行政区划、栅格数据等 9个抽象要素类,建立了 “各市基本情况”对象类,与表明各地区域的 “城市群”类相连接,将山东半岛城市群8 个地级市的地理位置数据与地区的基本资料数据有机地联系起来。
2) 地质要素集实体 UML 类图 ( FD_Geology) 。
3) 国土资源要素集实体 UML 类图 ( FD_LandResource) 。
4) 水资源要素集实体 UML 类图 ( FD_WaterResource) 。
5) 生态环境要素集实体 UML 类图 ( FD_Environment) 。
6) 辅助要素集实体 UML 类图 ( FD_Ancillary) 。
3. 山东半岛城市群项目数据实体关系图
1) 数据集实体 ER 图 ( MGRD_DataSet) 。
2) 研究成果报告数据实体 ER 图 ( MGRD_SummaryReport) ( 图 12 - 9) 。
图 12 -9 研究成果报告数据实体 ER 图 ( MGRD_SummaryReport)
七、山东半岛城市群项目数据包数据字典
( 一) 数据集实体 ( MGRD_DataSet)
山东半岛城市群地区地质-生态环境与可持续发展研究
( 二) 研究成果报告数据实体 ( MGRD_SummaryReport)
1. 文字报告数据实体 ( SR_WordReport)
山东半岛城市群地区地质-生态环境与可持续发展研究
2. 成果图件数据实体 ( SR_ThemeMapSet)
( 1) 基础地理要素集实体 ( FD_Geography)
山东半岛城市群地区地质-生态环境与可持续发展研究
( 2) 地质要素集实体 ( FD_Geology)
山东半岛城市群地区地质-生态环境与可持续发展研究
( 3) 水资源要素集实体 ( FD_HydroResource)
山东半岛城市群地区地质-生态环境与可持续发展研究
‘伍’ 地质-生态环境空间数据库建设指南
一、编写目的
建立山东半岛城市群地质-生态环境空间数据库,是“山东半岛城市群地区地质-生态环境综合调查评价及可持续发展研究”项目的设计要求,而山东半岛城市群地质-生态环境空间数据库建设,涉及地质、环境、水文、矿产等专业,并涉及单位较多,需要提交入库的数据也较多,为了指导和规范数据库项目的建设,特编写本指南,重点从建库的数据整理与格式转换阶段规范工作流程,明确最终提交成果,同时对元数据的填写做出了详细规定,本指南对山东半岛城市群空间数据库建设具有指导作用。
二、适用范围
本指南适用于山东半岛城市群地质-生态环境空间数据库建设工作。
三、编写依据及参考标准
1.国家及行业标准
GB/T2260—1999中华人民共和国行政区划代码
GB/T17798—1999地球空间数据交换格式
GB/T13923—92国土基础信息数据分类与代码
GB/T17766—1999固体矿产资源/储量分类
GB/T13989—92国家基本比例尺地形图分幅和编号
GB/T9649—88地质矿产术语分类代码
GB/T9649.16—1998地质矿产术语分类代码矿床学
DZ/T0197—1997数字化地质图图层及属性文件格式
2.部门标准
GX199900X-200X国土资源信息高层分类编码及数据文件命名规则国土资源部省级矿产资源规划编制指南国
国土资源部矿产资源储量数据库标准
中国地质调查局空间数据库工作指南2.0版
版山东半岛城市群地质-生态环境空间数据库建库标准(试行稿)
四、数据库框架设计
1.数据库需求分析
山东半岛城市群数据库是在“山东半岛城市群生态环境地质”项目研究成果的基础上研制、基于Arcinfo平台的空间数据库系统,其总体目标是存储和管理“山东半岛城市群生态环境地质”项目研究成果的资料、信息、地图及提供查询服务,为山东半岛城市群的空间布局管理、规划和决策以及重大项目建设和经济社会可持续发展提供依据。为达成这一总体目标,对数据库建设的需求应该包括以下方面:
1)对项目成果图件及其他数据存储管理的需求,需要构建一个符合要求的空间数据库。
2)提供对山东半岛城市群生态环境地质研究成果的管理、查询与展示。
3)提供山东半岛城市群生态、环境的现状与分级分布情况。
4)组织山东半岛城市群生态环境专题图件,直观地为决策咨询提出相应的对策和解决方案。
(1)功能需求
通过需求分析,得到软件的功能需求。除基本的数据输入、编辑和管理功能外,本系统还应具有以下4个方面的要求:
1)对现有地质-生态环境问题的展示、查询;
2)地质-生态环境质量现状的分析;
3)对地质-生态环境与可持续发展关系的分析评价;
4)保持经济增长和地质-生态环境相协调的对策与建议。
(2)性能需求
本数据库系统的性能需求为:
1)系统稳定性好;
2)可扩展性好;
3)操作简单;
4)可移植性好;
5)保密性。
根据“山东半岛城市群地区地质-生态环境综合调查评价及可持续发展研究”项目需求分析,数据库涉及的基础图件和数据、项目研究的成果数据如下:
1)基础地理、地质图件,采用1∶20万的地理底图和经过简化的地质底图。
2)各专题项目编汇的成果图件,包括:
山东半岛城市群地区地质图;
山东半岛城市群地区卫星遥感影像图;
山东半岛城市群地区区域稳定性综合评价图;
山东半岛城市群地区土地资源环境质量评价图;
山东半岛城市群地区矿产资源综合评价图;
山东半岛城市群地区地表水评价图;
山东半岛城市群地区地下水环境评价图;
山东半岛城市群地区海岸带地质灾害分布图;
山东半岛城市群地区生态环境综合评价图;
山东半岛城市群地区地质灾害易发区分布图;
山东半岛城市群地区地质生态与经济可持续发展对策图;
烟台地区地壳稳定性评价分区图;
烟台地区地质-生态环境分析与评价图;
烟台地区生态功能区划与生态市建设规划图;
青岛地区地壳稳定性评价分区图;
青岛地区海岸带地质环境质量评价图;
青岛地区地质-生态环境评价分区图。
3)属性数据;
4)文字报告;
5)专题图件数据。
2.数据库系统架构
根据以上对数据库需求的分析,结合目前项目的需要和经费情况,采用的系统架构见图12-1。
图12-1 数据库系统架构
本项目采用 ArcGIS Desktop 来搭建系统平台,用以实现定义好的空间数据和非空间数据的存储和管理。系统的核心采用地理数据库 GeoDataBase 体系结构。在后台通过 ArcCat-alog 应用模块来组织和管理所有的 GIS 信息,比如地图、数据集、模型、元数据、服务等; 通过 ArcToolBox 工具来完成数据转换、叠加处理、地理编码、统计分析和投影变换等数据处理。
客户端采用定制的 ArcMap,用以完成数据的显示、分析和编辑。另外可以通过 Arc-GIS 的扩展模块来实现对空间数据进行高效率的可视化和分析; 用 ArcGIS Spatial Analyst实现栅格数据的显示和处理。ArcGIS Desktop 系统平台表现示例见图 12 -2。
在系统数据库建成之后,如项目的后期需要进行数据的共享和发布,可采用 ArcSDE +ArcIMS 的搭配来实现 B / S 构架的数据共享。
图12-2 ArcGIS Desktop系统平台表现示例
3.数据库系统功能软件的系统功能分为基本系统数据管理功能和专业应用扩展功能两大部分。根据需求分析,确定各部分的功能。
1)基本功能部分:包括系统管理,数据输入、编辑、查询和输出,数据处理和图形符号库管理等。
2)扩展功能部分:包括现状展示、分析评价、可持续发展评价和决策支持等。系统的功能模块构成见图12-3。
图12-3 系统的功能模块构成
4.系统软件平台
在本项目的研究中,结合调查评价研究项目的工作实际,选取了美国ESRI公司的ArcGIS软件作为数据库开发的GIS软件平台,同时考虑到各专题研究单位的实际情况,选取MapGIS作为电子图件的绘制软件。在汇总各专题研究单位提交的MapGIS数字图件后,进行MapGIS格式数据向ArcGIS格式数据的转换,将研究成果加载到项目统一的地质-生态环境空间数据库中。本项目选择的ArcGIS软件平台包括ArcGISDesktop、ArcS-DE、ArcIMS等组件。
5.硬件平台选择
除按系统平台的选择原则外,硬件选择从以下方面考虑:
1)硬件的性能:能够满足系统软件平台的运行需求;
2)与其他硬件的兼容性:各种硬件设备可以协同工作;
3)与软件的兼容性:要兼容操作系统、数据库软件或其他应用软件。
可利用现有的计算机硬件,适当增设需要的硬件来构造系统的硬件环境。
6.系统实现步骤
(1)系统设计
1)总体结构设计:主要指系统中各子系统之间关系的设计。
2)系统各子系统或子功能模块的描述:各功能模块要划分到软件单元的层次,要求描述清晰,以满足编码、编译和测试的需要。
3)系统外部接口设计:完成系统外部接口、各软件单元之间的详细设计。
4)数据结构和数据库设计:主要指规划数据组织与表达方式的设计。
5)界面设计:主要指应用系统的操作界面设计。
6)软、硬件设计:主要指系统软硬件运行环境的设计。
7)系统单元测试的详细计划:包括测试集、测试用例和测试步骤。
(2)软件编程
完成程序代码的编写及数据库建库任务。
1)遵照软件设计说明书的要求,利用编程工具编制程序代码,并完成程序代码的测试工作。
2)按照半岛城市群项目数据库标准及数据库建库规范的要求,完成数据建库工作。
(3)系统集成与测试
完成系统集成及测试,生成可实际运行的系统,编写用户使用手册。
1)系统集成。
2)系统集成测试。集成测试的步骤为:
①制定系统各单元、模块、子系统的集成计划和集成测试计划,内容包括测试要求、步骤、数据和时间表等;②编写系统集成、测试文档;③按计划进行系统集成与集成测试,修改错误,再测试,直到符合设计要求;④编写测试报告。
3)编写用户使用手册。
五、数据入库工作流程
工作流程主要用于对规划数据库数据入库方法和过程进行指导。项目数据库的数据入库流程见图12-4。
图12-4 数据入库流程
1.资料收集
主要包括图件、表格和文字资料等项目所涉及的数据和成果。
2.资料预处理
数据预处理就是在全面收集资料的基础上,对资料进行系统的分析研究、综合整理及筛选等。
3.建库文档准备
主要是指对建库所需的文档进行准备,主要为数据整理记录表、属性填卡表准备,MapGIS编图的花纹符号库、线型库、颜色库设定等。
4.数据采集
数据的采集主要包括图件的输入、建立分层文件、属性的输入。
5.数据整理
数据整理的主要内容为:检查数据分层,重新命名分层文件,补充新增图层、调整部分地理、地质和规划专题属性结构,增加部分属性表格,以及整理附加文档等,完成上述工作后要填写元数据采集表并完成对元数据的录入,最后,对所有文件要进行标准化命名。
6.空间数据格式转换
按照项目建库的统一要求,各子项目在MapGIS平台下完成的成果图件,数据需要向ArcInfo格式进行转换。
六、数据质量监控
1.质量监控体系
项目承担单位和实施单位要建立完善的规划数据库建设质量监控体系,并制定相应的制度。
(1)自互检
建立完整的自互检表,每个作业人员的建库工作都要进行100%的自检,并将自检所发现的问题及时改正。在自检的基础上,由项目负责人安排其他作业人员进行60%以上的互检,并将互检结果和修改处理结果如实、完整地记录下来。
(2)抽检
每张图完成后,由项目负责抽取10%进行检查,并确保检查内容全部符合质量要求。
(3)阶段性检查
对建库的每个阶段性成果要进行严格检查把关,如图件扫描矢量化后的图元检查;属性录入后的图元、属性一致性检查等。
2.数据质量监控
(1)空间数据质量检查
空间数据质量检查主要是对成果图上的内容进行质量检查,要分别对MapGIS和ArcInfo格式的所有图层进行逐项检查,包括入库数据图层套合精度、拓扑、命名的标准化规范化、分层的正确性、数据的完整性、属性表结构的正确性、图元与属性的对应性、属性代码的准确性等。
(2)图面质量检查
图面检查是指对提交的成果数据图进行图面内容检查,发现错误应及时修改完善,直至准确无误。
(3)数据表数据质量检查
是指对非空间数据表和空间属性数据表检查数据的正确性,检查数据结构的一致性,并对照规划文本检查与规划实施相关内容的完整性和正确性。
(4)文档检查
资料文档检查主要是检查数据库所要求的文本、研究报告、编制说明、附表等资料文档是否齐全,内容是否正确,并检查元数据采集表及入库数据内容是否合乎要求。
3.数据质量监控指标
上述内容的检查总错误率小于2%,其中,图元(包括点、线、面、注释)错误率小于1%,属性(包括文字、代码、ID号对应、记录个数等)错误率小于2%,凡错误率大于该两值的,或发生图层缺失、附表缺失、文档缺失以及未提交正确的元数据采集表和入库数据的,一律不予通过。
七、提交数据要求
1.提交格式
成果图件:MapGIS格式,含工程、图层和系统库文件。
文档:包括编制说明、研究报告及其他文档资料(Word和Html两种格式)。表格:Access和Excel两种格式。
元数据采集表:Word格式。
2.提交形式
汇交数据存储介质为光盘。在提交成果之前,要进行全面查杀毒,确保数据安全。