当前位置:首页 » 操作系统 » 化石数据库

化石数据库

发布时间: 2024-03-26 21:32:26

‘壹’ 古生物化石标本数据库的服务对象有哪些

古生物化石标本数据库是国土资源部按照《古生物化石保护条例》有关规定,组织古生物化石管理、标本馆藏、研究和信息技术等相关领域的力量共同建立的。该系统的建设目标分为长期目标和近期目标两种。

长期目标的服务对象主要包括4个方面,即《古生物化石保护条例》规定的各级国土资源主管部门、古生物化石标本馆藏单位、古生物化石研究单位和普通公众。长期目标具体为:第一,满足各级主管部门开展古生物化石标本管理工作中对现有标本的信息需求,例如,不同门类、不同地域、不同时代的化石标本数量、分布、保存现状、流转历史,甚至单件化石标本的详细情况等;第二,满足收藏单位自身日常管理的需要,如标本库存登记、借出登记、流转登记等;第三,为科研单位开展科学研究提供便利,如研究人员可以从大量标本数据中提炼出共性信息;第四,满足普通公众对化石科普信息的需求,例如,项目组将针对部分重要门类的化石编写科普词条,并与数据库建立关联,方便普通公众建立基本的生物进化及地质历史概念。

为满足当前急需,近期目标在2015年前完成,服务对象只包括两个方面,即两级主管部门(国土资源部及各省、自治区、直辖市国土资源厅)和收藏单位。近期目标具体为:第一,满足两级主管部门掌握各自管辖范围内重点保护古生物化石标本的基本情况需求,如数量、分布等,以及出入境化石标本的基本信息;第二,对于目前没有建立收藏标本数据库的单位,按照统一要求建立标本数据库,实现标本日常管理;对于已经建立并应用标本数据库的单位,通过开发接口的方式妥善解决两套系统之间的自动关联与更新机制,在尽可能不影响对原有系统使用的情况下,实现收藏标本数据与两级主管部门之间的数据连通与更新。

‘贰’ 数据管理技术的发展趋势是什么

20世纪50年代中期以前,计算机主要用于科学计算。硬件方面,计算机的外存只有磁带、卡片、纸带,没有磁盘等直接存取的存储设备,存储量非常小;软件方面,没有操作系统,没有高级语言,数据处理的方式是批处理,也即机器一次处理一批数据,直到运算完成为止,然后才能进行另外一批数据的处理,中间不能被打断,原因是此时的外存如磁带、卡片等只能顺序输入。
人工管理阶段的数据具有以下的几个特点。
(1)数据不保存。由于当时计算机主要用于科学计算,数据保存上并不做特别要求,只是在计算某一个课题时将数据输入,用完就退出,对数据不作保存,有时对系统软件也是这样。
(2)数据不具有独立。数据是作为输入程序的组成部分,即程序和数据是一个不可分隔的整体,数据和程序同时提供给计算机运算使用。对数据进行管理,就像现在的操作系统可以以目录、文件的形式管理数据。程序员不仅要知道数据的逻辑结构,也要规定数据的物理结构,程序员对存储结构,存取方法及输入输出的格式有绝对的控制权,要修改数据必须修改程序。要对100组数据进行同样的运算,就要给计算机输入100个独立的程序,因为数据无法独立存在。
(3)数据不共享。数据是面向应用的,一组数据对应一个程序。不同应用的数据之间是相互独立、彼此无关的,即使两个不同应用涉及到相同的数据,也必须各自定义,无法相互利用,互相参照。数据不但高度冗余,而且不能共享。
(4)由应用程序管理数据:数据没有专门的软件进行管理,需要应用程序自己进行管理,应用程序中要规定数据的逻辑结构和设计物理结构(包括存储结构、存取方法、输入\输出方式等)。因此程序员负担很重。
综上所说,所以有人也称这一数据管理阶段为无管理阶段。
2. 文件系统阶段:
20世纪50年代后期到60年代中期,数据管理发展到文件系统阶段。此时的计算机不仅用于科学计算,还大量用于管理。外存储器有了磁盘等直接存取的存储设备。在软件方面,操作系统中已有了专门的管理数据软件,称为文件系统。从处理方式上讲,不仅有了文件批处理,而且能够联机实时处理,联机实时处理是指在需要的时候随时从存储设备中查询、修改或更新,因为操作系统的文件管理功能提供了这种可能。这一时期的特点是:
(1)数据长期保留。数据可以长期保留在外存上反复处理,即可以经常有查询、修改和删除等操作。所以计算机大量用于数据处理。
(2)数据的独立性。由于有了操作系统,利用文件系统进行专门的数据管理,使得程序员可以集中精力在算法设计上,而不必过多地考虑细节。比如要保存数据时,只需给出保存指令,而不必所有的程序员都还要精心设计一套程序,控制计算机物理地实现保存数据。在读取数据时,只要给出文件名,而不必知道文件的具体的存放地址。文件的逻辑结构和物理存储结构由系统进行转换,程序与数据有了一定的独立性。数据的改变不一定要引起程序的改变。保存的文件中有100条记录,使用某一个查询程序。当文件中有1000条记录时,仍然使用保留的这一个查询程序。
(3)可以实时处理。由于有了直接存取设备,也有了索引文件、链接存取文件、直接存取文件等,所以既可以采用顺序批处理,也可以采用实时处理方式。数据的存取以记录为基本单位。
上述各点都比第一阶段有了很大的改进。但这种方法仍有很多缺点,主要是:
(1)数据共享性差,冗余度大。当不同的应用程序所需的数据有部分相同时,仍需建立各自的独立数据文件,而不能共享相同的数据。因此,数据冗余大,空间浪费严重。并且相同的数据重复存放,各自管理,当相同部分的数据需要修改时比较麻烦,稍有不慎,就造成数据的不一致。比如,学籍管理需要建立包括学生的姓名、班级、学号等数据的文件。这种逻辑结构和学生成绩管理所需的数据结构是不同的。在学生成绩管理系统中,进行学生成绩排列和统计,程序需要建立自己的文件,除了特有的语文成绩、数学成绩、平均成绩等数据外,还要有姓名、班级等与学籍管理系统的数据文件相同的数据。数据冗余是显而易见的,此外当有学生转学走或转来时,两个文件都要修改。否则,就会出现有某个学生的成绩,却没有该学生的学籍的情况,反之亦然。如果系统庞大,则会牵一发而动全身,一个微小的变动引起一连串的变动,利用计算机管理的规模越大,问题就越多。常常发生实际情况是这样,而从计算机中得到的信息却是另一回事的事件。
(2)数据和程序缺乏足够的独立性。文件中的数据是面向特定的应用的,文件之间是孤立的。不能反映现实世界事物之间的内在联系。在上面的学籍文件与成绩文件之间没有任何的联系,计算机无法知道两个文件中的哪两条记录是针对同一个人的。要对系统进行功能的改变是很困难的。如在上面的例于中,要将学籍管理和成绩管理从两个应用合并成一个应用中,则需要修改原来的某一个数据文件的结构,增加新的字段,还需要修改程序,后果就是浪费时间和重复工作。此外,应用程序所用的高级语言的改变,也将影响到文件的数据结构。比如BASIC语言生成的文件,COBOL语言就无法如同是自己的语言生成的文件一样顺利地使用。总之数据和程序之间缺乏足够的独立性是文件系统的一个大问题。
文件管理系统在数据量相当庞大的情况下,已经不能满足需要。美国在60年代进行阿波罗计划的研究。阿波罗飞船由约200万个零部件组成。分散在世界各地制造。为了掌握计划进度及协调工程进展,阿波罗计划的主要合约者罗克威尔(Rockwell)公司曾研制了一个计算机零件管理系统。系统共用了18盘磁带,虽然可以工作,但效率极低,维护困难。18盘磁带中60%是冗余数据。这个系统一度成为实现阿波罗计划的严重障碍。应用的需要推动了技术的发展。文件管理系统面对大量数据时的困境促使人们去研究新的数据管理技术,数据库技术应运而生了!例如,最早的数据库管理系统之一IMS就是上述的罗克威尔公司在实现阿波罗计划中与IBM公司合作开发的,从而保证了阿波罗飞船1969年顺利登月。
3.数据库系统阶段
从20世纪60年代后期开始,数据管理进入数据库系统阶段。这一时期用计算机管理的规模日益庞大,应用越来越广泛,数据量急剧增长,数据要求共享的呼声越来越强。这种共享的含义是多种应用、多种语言互相覆盖地共享数据集合。此时的计算机有了大容量磁盘,计算能力也非常强。硬件价格下降,编制软件和维护软件的费用相对在增加。联机实时处理的要求更多,并开始提出和考虑并行处理。
在这样的背景下,数据管理技术进入数据库系统阶段。
现实世界是复杂的,反映现实世界的各类数据之间必然存在错综复杂的联系。为反映这种复杂的数据结构,让数据资源能为多种应用需要服务,并为多个用户所共享,同时为让用户能更方便地使用这些数据资源,在计算机科学中,逐渐形成了数据库技术这一独立分支。计算机中的数据及数据的管理统一由数据库系统来完成。
数据库系统的目标是解决数据冗余问题,实现数据独立性,实现数据共享并解决由于数据共享而带来的数据完整性、安全性及并发控制等一系列问题。为实现这一目标,数据库的运行必须有一个软件系统来控制,这个系统软件称为数据库管理系统(Database Management System,DBMS)。数据库管理系统将程序员进一步解脱出来,就像当初操作系统将程序员从直接控制物理读写中解脱出来一样。程序员此时不需要再考虑数据中的数据是不是因为改动而造成不一致,也不用担心由于应用功能的扩充,而导致程序重写,数据结构重新变动。在这一阶段,数据管理具有下面的优点:
(1)数据结构化:数据结构化石数据库系统与文件系统的根本区别。在文件系统中,相互独立的文件的记录内部是有结构的,传统文件的最简单形式是等长同格式的记录集合。这样就可以节省许多储存空间.
数据的结构化是数据库主要特征之一。这是数据库与文件系统的根本区别。至于这种结构化是如何实现的,则与数据库系统采用的数据模型有关,后面会有较详细的描述。
(2)数据共享性高,冗余度小,易扩充。数据库从整体的观点来看待和描述数据,数据不再是面向某一应用,而是面向整个系统。这样就减小了数据的冗余,节约存储空间,缩短存取时间,避免数据之间的不相容和不一致。对数据库的应用可以很灵活,面向不同的应用,存取相应的数据库的子集。当应用需求改变或增加时,只要重新选择数据子集或者加上一部分数据,便可以满足更多更新的要求,也就是保证了系统的易扩充性。
(3)数据独立性高。数据库提供数据的存储结构与逻辑结构之间的映像或转换功能,使得当数据的物理存储结构改变时,数据的逻辑结构可以不变,从而程序也不用改变。这就是数据与程序的物理独立性。也就是说,程序面向逻辑数据结构,不去考虑物理的数据存放形式。数据库可以保证数据的物理改变不引起逻辑结构的改变。
数据库还提供了数据的总体逻辑结构与某类应用所涉及的局部逻辑结构之间的映像或转换功能。当总体的逻辑结构改变时,局部逻辑结构可以通过这种映像的转换保持不变,从而程序也不用改变。这就是数据与程序的逻辑独立性。举例来讲,在进行学生成绩管理时,姓名等数据来自于数据的学籍部分,成绩来自于数据的成绩部分,经过映像组成局部的学生成绩,由数据库维持这种映像。当总体的逻辑结构改变时,比如学籍和成绩数据的结构发生了变化,数据库为这种改变建立一种新的映像,就可以保证局部数据——学生数据的逻辑结构不变,程序是面向这个局部数据的,所以程序就无需改变。
(4)统一的数据管理和控制功能,包括数据的安全性控制、数据的完整性控制及并发控制、数据库恢复。
数据库是多用户共享的数据资源。对数据库的使用经常是并发的。为保证数据的安全可靠和正确有效,数据库管理系统必须提供一定的功能来保证。
数据库的安全性是指防治非法用户的非法使用数据库而提供的保护。比如,不是学校的成员不允许使用学生管理系统,学生允许读取成绩但不允许修改成绩等。
数据的完整性是指数据的正确性和兼容性。数据库管理系统必须保证数据库的数据满足规定的约束条件,常见的有对数据值的约束条件。比如在建立上面的例子中的数据库时,数据库管理系统必须保证输入的成绩值大于0,否则,系统发出警告。
数据的并发控制是多用户共享数据库必须解决的问题。要说明并发操作对数据的影响,必须首先明确,数据库是保存在外存中的数据资源,而用户对数据库的操作是先读入内存操作,修改数据时,是在内存在修改读入的数据复本,然后再将这个复本写回到储存的数据库中,实现物理的改变。
由于数据库的这些特点,它的出现使信息系统的研制从围绕加工数据的程序为中心转变到围绕共享的数据库来进行。便于数据的集中管理,也提高了程序设计和维护的效率。提高了数据的利用率和可靠性。当今的大型信息管理系统均是以数据库为核心的。数据库系统是计算机应用中的一个重要阵地。
产品数据管理(PDM)是以软件为基础,管理与产品相关的信息(包括电子文档、数字化文件、数据库记录等)和所有与产品相关的过程(包括审批/发放过程、工程更改过程、一般工作流程等)的技术。它提供产品全生命周期(包括市场需求调研、产品开发、产品设计、销售、售后服务)的信息管理,并可在企业范围内为产品设计和制造建立一个并行化的协作环境。
PDM技术最早出现于八十年代初期,目的是为了解决大量工程图纸、技术文档以及CAD文件的计算机化的管理问题,后来逐渐扩展到产品开发中的三个主要领域:设计图纸和电子文档的管理、材料报表(BOM)的管理以及与工程文档的集成、工程变更请求/指令的跟踪与管理。现在所指的PDM技术源于美国的叫法,是对工程数据管理(EDM)、文档管理(DM)、产品信息管理(PIM )、技术数据管理(TDM)、技术信息管理(TIM)、图像管理(IM)及其它产品信息管理技术的一种概括与总称。
PDM技术在全球的应用领域十分广泛,包括机械、电子、汽车、航空、航天以及非制造业等。目前,汽车工业已经在全球范围内开始实施PDM技术(如福特、通用等),航空/航天工业用PDM技术对企业进行重组(如波音、麦道等),非制造业(如交通、商业、电子出版等)应用PDM技术的增长速度也十分迅速。 PDM系统在文档管理、变更控制、配置管理与信息跟踪等方面也得到广泛的应用,并把它作为支持企业重组(如技术重组、产品重组、信息重组等)、并行工程、虚拟制造等的使能技术。
随着网络技术、数据库技术和O—O技术的发展,PDM技术得到了广泛的应用。PDM技术是目前世界上非常热门、且飞速发展的技术,据美国一家公司预测,今后五年内,每年将以30%的年增长率发展,带来的效益也相当可观。通过减少用户的信息查询时间、设计变更的通告时间以及设计人员之间方便的协作环境,可使新产品开发周期缩短30%以上。

一、PDM系统的主要功能

PDM系统为企业提供了一种宏观管理和控制所有与产品相关的信息的机制和构架,其主要功能包括:

1.电子仓库
它是PDM中最基本、最核心的功能,它保存了管理数据的数据(元数据)以及指向描述产品的相关信息的物理数据和文件的指针,它为用户存取数据提供一种安全的控制机制,并允许用户透明地访问全企业的产品信息,而不用考虑用户或数据的物理位置。

2.工作流或过程管理
用来定义和控制数据操作的基本过程,它主要管理当用户对数据进行操作时会发生什么,人与人之间的数据流向以及在一个项目的生命周期内跟踪所有事务和数据的活动。它是支持工程更改必不可少的工具。

3.产品结构与配置管理
以电子仓库为底层支持,以材料报表为其组织核心,把定义最终产品的所有工程数据和文档联系起来,实现产品数据的组织、控制和管理,并在一定目标或规则约束下向用户或应用系统提供产品结构的不同视图和描述。

4.查看和圈阅
为计算机化审批过程提供支持,用户利用该功能可以察看电子仓库中存储的数据内容(特别是图象或图形数据),如果需要,用户还可以利用图形覆盖技术对文件进行圈点和注释。

5.扫描与成像
把图纸或缩微胶片扫描转换成数字化图像,并把它置于PDM系统控制管理之下,为企业原有非数字化图纸与文档的计算机管理提供支持。

6.设计检索和零件库
对已有设计信息进行分类管理,以便最大程度地重新利用现有设计成果,为开发新产品服务。

7.项目管理
项目管理在PDM系统中考虑的较少,许多PDM系统只能提供工作流活动的信息。一个功能很强的项目管理器能够为管理者提供每分钟项目和活动的状态信息。

8.电子协作
主要实现人与PDM系统中数据之间高速、实时地交互功能,包括设计审查时的在线操作、电子会议等。

9.工具与“集成件”
为了使不同应用系统之间能够共享信息以及对应用系统所产生的数据进行统一管理,要求把外部应用系统“封装”和集成到PDM系统中,并提供应用系统与数据库以及应用系统与应用系统之间的信息集成。

二、PDM技术的发展趋势

1.网络技术在PDM系统中的应用越来越深入
基于网络平台和Java语言开发的结构灵活、用户界面友好的PDM系统已成为一种趋势。在PDM系统中通过Web实现全球化的信息查询、浏览、创建与更新已逐渐成为现实,并以此来支持全球化的虚拟企业的信息管理。

2.面向对象技术的应用及信息模型的标准化
由于PDM系统所要管理的数据类型及数据模型的复杂性,要求系统有良好的开放性,采用O一O方法建立系统管理模型与信息模型,并提供面向对象的建模工具与开发工具,支持用户的二次开发。另一方面,由于各系统功能不一样,其信息模型也不一样,即使是相同的功能,不同系统信息模型差别也很大,如何实现PDM系统信息模型的标准化,为不同系统之间提供信息交换带来方便成为当务之急。

3.PDM与MRP的功能渗透
一方面,PDM与MRP分别服务于工程设计与生产制造。PDM系统源于CAD/CAM应用与工程设计的需要,所以它管理的重点为工程信息。而MRP系统源于制造业的经营与生产活动的管理,包括经营、生产、物料需求的计划与制造资源的需求计划的管理。两者的桥梁纽带为BOM表。目前,二者之间通过相互集成,互为补充,构成完整的企业信息系统。另一方面,二者之间又互相渗。PDM厂商首先将工程BOM与制造BOM统一PDM系统中进行管理,同时将经营计划、生产计划集成于PDM系统中,而MRP系统也在设法PDM系统的功能归人其中。

4.过程管理与配置管理功能的强化
为了适应产品设计与制造过程中复杂过程变的需要,各厂商竞相开发出独立的工作流程管理块,且功能不断变强,以满足工程更改、并行化产设计所必需的过程管理的需要。以配置管理为核心,将数据管理、工作流程管理与变更控制集于一体,形成更为强大的PDM系统。

‘叁’ 提供WWW服务的JAFOV数据库

K.Yamamoto

(Koka Women's College,38 Kadonocho,Nishikyogoku,Ukyo,Kyoto 571,Japan)

N.Nishiwaki

(Nara University,1500 Misasagicho,Nara 631,Japan)

摘要JAFOV是一个描述日本脊椎动物化石标本的数据库,存储了大约4500个标本的有关数据。数据库于1982年建立在日本Kyoto大学数据处理中心的大型机上,并以联机形式提供对外服务。这个系统使用不方便且图像处理功能弱,因此我们试图运用WWW技术来解决这些问题。WWW提供非常美观、友好的用户界面,是一条在因特网上处理各种多媒体信息的有效途径。在本项研究中,我们使用WWW技术开发了一个基于因特网的新型JAFOV服务系统原型。经过试运行,我们认为建立的新系统对JAFOV这类数据库的改造是适合的。

关键词数据库化石脊椎动物标本因特网WWWDBMS

1引言

JAFOV是日本脊椎动物化石标本数据库。它于1982年建成,记录了大约4500个标本的描述数据。数据库存放在日本Kyoto大学数据处理中心的大型机上,以联机数据库的形式提供对外服务。然而,数据库还存在一些问题,如不易使用、图像(标本的照片念丛或草图)联机处理功能弱等。

在本项研究中,我们试着应用WWW技术使系统的使用更加容易并增强图像的联机处理能力。WWW提供非常美观、友好的用户界面,是一条在因特网上处理各种多媒体信息的有效途径。将它与DBMS连接,我们可以获得一个比当前使用的JAFOV联机数据库更好的服务系统。

在本项研究中,对要开发的目标系统有以下几点要求:

(1)数据检索可以通过WWW浏览器仔早樱如Mosaic,Netscape等进行;

(2)能处理的数据不仅包括文档和数字,还应包括化石的图像;

(3)检索到的数据能直接在终端上显示、打印或下载到用睁燃户计算机上。

2JAFOV简介

2.1数据库内容

名字JAFOV来源于jApanese FOssil Vertebrate(日本脊椎动物化石)的缩写。它是一个由日本脊椎动物化石标本描述的数据组成的数据库。JAFOV数据库的内容包括化石标本的文档、数字和图像数据,见图1。不过到目前为止,只有文档数据已经入库,而由于某些原因(主要是技术上的),数据库还远没有实现。

图1JAFOV数据库的原始设计

JAFOV使用一个称为FAIRS的DBMS层次模型。它专为富士通公司制造的大型计算机而设计。这个DBMS适合于文档数据库,如正在使用的JAFOV,它为那些作为查找关键词而经常使用的数据项生成一个倒排文件以加速查找过程。这个模型不适合于处理数字和图像数据。

JAFOV由41个数据项(表1)组成,内容包括标本的描述、地理位置、地质层位、保管人及其它有关信息等。它们被归类为8个组,即:名字、类属、产地、化石形成层位、地质年龄、化石区段、标本保管人和相关参考书目。其中一部分数据项被定义为查找键,其余除少量仅供输出外,均作为文本数据项进行查找。

表1JAFOV数据库中的数据项

大部分数据项的值直接从原始数据输入,其余则通过使用字典和/或转换表从其它数据项获取值。如转换表中箭头所示,有一些数据项的值通过已有的转换表生成,还有一些则从父数据项中摘取生成。这些数据项的存在减少了数据输入工作量并大大降低了数据出错率。

2.2数据库结构

JAFOV数据库由JAFOV工作组建立和维护,它是日本脊椎动物化石学家协会(AVPJ)下的一个志愿小组。

建立JAFOV数据库的过程如图2所示。原始数据由日本的古生物研究所(所)及博物馆的志愿者提供。他们填写有关他们标本的数据采集单并交给工作组。工作组检查数据单并把内容输入到计算机形成原始计算机数据,由计算机的数据转换程序自动把它转换成JAFOV需要的输入数据。在这个过程中,一些数据项的数据通过参照从代码表得到的字典文件被生成,另一些项的数据则从父数据项中摘取。随后以JAFOV的格式打印出数据列表,并送回给数据提供者作校验。如果需要,原始计算机数据还将根据数据提供者的规范要求进行校正。此后,JAFOV的输入数据准备完毕,DBMS根据其数据定义将输入数据送到JAFOV。到这个时候,数据库中建立了两个文件:数据文件和它的倒排文件。

图2建立JAFOV数据库的过程

2.3当前提供服务的方式

目前,JAFOV作为联机数据库已经运行于Kyoto大学数据处理中心的大型机上,提供服务的主要方式见图3。可以通过直接或间接(即通过其它计算中心)联接到中心的一台终端来使用数据库。几年前因特网尚未建成,对数据库的存取只能通过连接在大学计算机互联网络(NACSIS)上的计算中心进行,而且还要对用户进行验证和收费。

图3当前JAFOV提供服务的方式

图4显示的是目前JAFOV的使用方法。用户使用telnet将终端直接或通过前面提及的其它计算中心间接地连接到Kyoto大学数据处理中心的主计算机上,以telnet方式登录计算机,然后使用图中所示命令交互式地查询他需要的数据。

3WWW版本的JAFOV

3.1需要改进的地方及解决方法

现行的JAFOV系统有许多有待改进的问题,尤其是其服务方式。系统的使用应该更加容易、更加广泛,并且还应提供除文档处理以外的数据处理能力。存在的主要问题包括:

(1)不友好的用户界面:现在的用户界面是命令行方式(如图4),对研究人员很不方便;

图4当前JAFOV的使用方式

(2)服务受限制:使用JAFOV之前需要注册到NACSIS的某一计算中心,也就是说只有注册的用户才能使用数据库;

(3)建立和维护多媒体数据库困难;

(4)在大型机上建立和维护JAFOV成本太高。

而WWW技术为这些问题提供了很好的解决方案:

(1)可以使用WWW浏览器漂亮、友好的图形用户界面;

(2)通过因特网进行二进制数据变换很方便;

(3)提供很好的图像文件显示;

(4)通过因特网可以实现更广范围的存取。

为此,我们试着开发了JAFOV的一个WWW版本,其规范要求和功能在下文描述。

图5JAFOV的WWW服务简图

3.2JAFOV的WWW服务概貌

JAFOV的WWW服务框架见图5。当用户使用WWW浏览器通过因特网访问到服务器时,JAFOV的首页(图6)显示在其计算机上。用户在该页上输入搜索条件并提交页面,然后与条件匹配的记录/标本被检索出来,并将其登记号以可点击按钮(图7)的形式显示在客户计算机上。用鼠标单击任一登记号,可以显示该记录的内容,见图8。

图6JAFOV的WWW服务首页

图7查询JAFOV得到的结果记录列表

图8记录的内容

上例显示的查找过程与图4所示例子相同。毫无疑问,这里显示的方法比当前正在使用的方法对用户要友好得多。

3.3WWW版JAFOV的DBMS

在本项研究中,我们开发了一个原始DBMS,并以此建立了WWW版JAFOV的一个原始数据库。WWW版JAFOV的结构见图9,它由两类文件组成,即主文件和附加文件。主文件包含文档数据和图像数据文件名。篇幅长的文档数据如参考文献也可以文件形式单独存储,而在主文件中只存储相应的文件名。虽然这类数据不能被检索,但可以使查询时间更短。图像数据是作为附加文件存储的。

图9WWW版JAFOV数据库的结构

主文件是一个文本型简单文件,其中定义了数据项/域。它由“项/域定义记录”和“标本数据记录”组成。项/域定义记录以CSV(即以逗号分隔的变量)的形式置于文件的第一个记录。接下去是与项/域定义记录有相同格式和顺序的标本数据记录。一个标本使用一个记录。文件可以由任意一种文本编辑器生成。

在检索生成的页面中,图像和文本文件以超文本形式连接起来。页面中嵌入了一个标志,它连接到图像或文本文件。当点取该标志时可以显示与之连接的图像或长文本数据。标志在页面上以可点取的按钮形式显示。

3.4系统的查找过程

一般说来,WWW服务中的数据检索通过公共网关接口(CGI)来处理,如图10。通过使用HTML的表功能生成的页面显示在客户计算机的WWW浏览器上。当用户在页面中输入搜索条件并按“发送”按钮后,条件通过CGI接口送到DBMS,数据搜索开始。检索到的数据以HTML文件的格式送回客户端并显示在客户计算机上。

图10通过WWW进行信息检索的通用机制

图11显示的是我们开发的系统中数据库检索及结果显示的机理。系统基本上使用CGI接口。首先,用户输入的条件通过CGI送到数据检索模块。模块在数据主文件中查找数据,并生成一个临时文件和一个HTML文件,检索到的记录在HTML文件中以可点取按钮(图7)的形式列出来。检索中可以使用多个查找条件,但条件之间只能是“与”的关系。

然后服务器把模块生成的HTML文件送回客户端。用户可以用鼠标单击记录以显示查到的详细资料。当单击任一标本登记号时,信息也是通过CGI送到显示模块。模块使用选定的文件生成HTML格式的显示页面,并将它送回客户端。于是,与记录有关的图像就通过相应的文件名连接到页面上。

图6~8是执行检索的一个例子。图6是用户输入查询条件的页面,即首页。图7是输入条件为“‘名字’中包含‘NAUMANNI’”时获得的查询结果。查询得到了两个标本并显示为图中可点取的按钮。这一页通过图11中的数据查询模块生成。同时,检索到的数据其全部内容保存在图11中的选定数据文件中。图8是单击图7中按钮后显示的记录内容。这一页通过图11中的显示模块生成,它从选定文件中检索出数据并使用一个模板来生成本页。

4结论

在本项研究中,我们通过使用WWW技术开发了一个基于因特网的原型系统,很好地改进了JAFOV数据库和其提供服务的方式。改进的方面包括:

(1)显着改善了用户界面,用户对系统的使用更加方便;

(2)使用数据库的范围变得更为广泛,因为WWW服务不需要预先注册,所有能连接到因特网上的客户都能使用;

(3)数据库可以像处理文本数据那样方便地处理图像数据。

这些改进很好地解决了JAFOV当前版本中存在的大部分问题。

然而,要使这个系统在因特网上实际运行,还有一些问题需要解决,这些问题主要包括:

(1)查询数据需要的时间偏长;

数学地质和地质信息

(2)本项研究中开发的DBMS可以达到的实际容量是1000个记录,当存储记录数超过该数目时,数据查询将花费更长的时间。

通过使用功能更强大的DBMS如RDBMS作为搜索引擎,这些问题可以得到解决。因此,我们正在使用RDBMS来开发实用型系统。

致谢笔者衷心感谢Toyo信息系统有限公司的Shintaro Inoue先生,他参与了本系统的开发,还要感谢CSK有限公司的Koushiro Miyauchi先生,他对本项研究中使用的计算机作了软硬件配置与调试。(龚仁辉译,陈建平校)

参考文献

[1]T.Kamei,K.Yamamoto,and N.Nishiwaki.Database on Fossil Vertebrate Specimens Deposited in Japan:JAFOV.Bull.Data Proc.Cent.,Kyoto Univ.,1986,19(4):260~268(in Japanese).

[2]N.Nishiwaki.Database on Fossil Specimens Deposited in Japan.Proc.3rd Intern.Conf.Geosci.Inf.orm.(Adelaide,Australia).Australian Mineral Foundation,1986,1:62~70.

[3]N.Nishiwaki,K.Yamamoto,and T.Kamei.Data Base on the Japanese Fossil Vertebrates.P.S.Glaeser(Ed.)Data for Science and Technology.Proc.8th Intern.CODATA Conf.(Jachranka,Poland),North-Holland Pub.Co.,1982,75~80.

[4]K.Yamamoto,N.Nishiwaki,and T.Kamei.JAFOV:Data Base on the Japanese Fossil Vertebrates(1).Geol.Data Proe.,1982,7:21~30(in Japanese).

[5]K.Yamamoto,N.Nishiwaki,and T.Kamei.Present Status and Future Extension of JAFOV:Database on the Japanese Fossil Vertebrates.Geol.Data Proc.,1987,12:142~150(in Japanese).

[6]K.Yamamoto,N.Nishiwaki,and Y.Kawamura.An Extension of the Japanese Fossil Vertebrates Database JAFOV.Bull.Data Proc.Center,Kyoto Univ.,1994,27(3):117~120(in Japanese).

[7]H.Horiike,Y.Ozawa,Y.Murao,and T.Watanabe.User's Manual:Database Retrieval with FAIRS.Data Proc.Cent.,Kyoto Univ,1984(in Japanese).

[8]L.Aranson.HTML Manual of Style.Ziff-Davis Press,Emeryville,California,1994.

‘肆’ 中国数字植物标本馆的数据库

1.标本信息
提供成员单位标本馆所完成的数字化标本信息,包括一般标本及模式标本。每份标本信息包括标签信息及图像信息,前者包括标本采集人、采集日期、地点、生境与海拔以及鉴定信息和标本存放地点(标本馆)等。
目前在CVH网上能查询到中科院系统13家标本馆标本,共计二百八十五万份(笔)标本信息及一百五十五万张标本图像,缺乏图像的记录已在首页予以标明。
网上模式标本6500份,仅包括中科院植物所标本馆馆藏的模式标本,包括裸子植物、毛茛科、荨麻科、山茶科、壳斗科等类群。信息均经过核实,还附有发表新种的原始文献(PDF格式)以及高分辨率标本图像。
分布式标本信息检索系统:目前CVH的标本信息是通过集中式实现共享查询的,其主要缺陷是更新周期长,存储压力大。我们正在试验的分布式标本信息查询系统已有5家标本馆(称CVH分馆)参与,共有100多万份标本信息实现实时更新,并由成员单位通过FTP自主管理其分馆,有效地发挥成员单位的积极性。
2.《中国植物志》数据库
包括全套《中国植物志》79卷(除第一卷外)125册图书的PDF文件,可通过科名和植物名称(学名、中名)查询到志书文字及图版。最近完成的检索文件复核补充工作使数据库更全面准确地反映植物志的内容,除正名(accepted name)外,讨论部分的学名也可查到。数据库记录数:45000余条。
3.彩色图库
上传到CVH网站上的植物彩色照片共计五万余张,属于269科5700种,为近年来众多志愿者自野外拍摄所得,范围涉及在全国34个省(区、市)的野生植物。下阶段将逐步建立彩图鉴定专家系统,以提高照片鉴定准确性。
至此,用户输入学名或中名可关联性查询到标本、植物志及彩色图片三大数据库,这也是CVH的主要数据库。
4.其他相关数据库
为方便用户使用标本信息,“中国数字植物标本馆”网站还提供其他大量相关的(植物学)数据库,如标本采集地名与标本馆数据、分类研究人员及其研究论文题录等。这些数据库或源自实际工作经验的总结、或直接转自权威工具书并经过专家审核。
1)《中国高等植物图鉴》数据库
为该书全套五册正编及两册补编共7本书的全文检索。可通过科名和植物名称(学名及中名)查询到书中正文文字及图画。数据库记录数:9057条。
2)地方植物志及其统一查询
提供12套地方志的数字化文挡(PDF文件),可通过统一关联查询任何1-12种植物志信息,包括西藏、秦岭、辽宁、贵州、浙江、海南等省(区/市)及地区植物志。下阶段计划实现《中国植物志》与地方植物志的关联查询。数据库记录数:47112条。
3) “三种主要志书属名数据库”
提供查询中国维管植物属名在《中国植物志》、《中国高等植物图鉴》和FLORA OF CHINA中的位子,包括卷册及页码。这三套志书(图鉴)是目前研究中国植物的主要参考书。该数据库的复核工作已于最近完成,增加了新近出版 FLORA OF CHINA卷册内容,并修改(修订)数百条记录,使数据更准确全面。数据库记录数:3504条。
4)植物名称及分布数据库
通过该库可以快速查询到中国种子植物名称及分布信息(到省级)等简单信息。资料主要来源于《中国植物志》和 已出版的Flora of China,可以认为是《中国植物志》的名录修订。目前数据库记录数:34056条。
5)模式标本名录及其原始文献数据库
该数据库以收集中国原生植物(Native plant)名称模式标本及其发表原始文献资料为宗旨,无论其模式标本采集地及保藏地在国内或国外、该名称何时于何种刊物发表都尽量予以收录。每条记录包括植物名称(学名、中名)、发表刊物,模式标本采集地点和生境、年代及标本采集人和采集号,以及标本存放地点(标本馆)。大部分资料以外文形式出现。数据库资料来源于国内外多种书刊,其中标本馆代码依 Holmgren et al.1990. Index Herbariorum和傅立国等1993《中国植物标本馆索引》(中国科技出版社)。缩写代号HT: Holotype, IT: Isotype, T: Type。目前数据库记录数:30705条
6)植物名称作者(命名人)数据库
据统计,至今为止,中国植物命名作者多达五千余人,其中命名两个及两个以上名称的有近3500人。本数据库就是基于这3500人的资料建立的,每条记录包括作者全名及标准缩写、工作/出生/生卒年代、专长类群等。中国作者(共919条目)还附有中文名及工作单位。本数据库依据国内外多种书刊资料编辑而成,其中人名拼写标准主要依据Brummitt & Powell 1992, Authors of Plant Names。类群代码为:A:藻类;B:苔藓;C:孢子植物;F:化石植物;M:真菌和地衣;P:蕨类;S:种子植物。目前数据库记录数:3481条。
7)中国植物分类学文献要览(1949-1990)
一般地,查询20世纪50年代以前中国植物学文献时可查询E.D.Merrill & E.H.Walker 《东亚植物学文献目录》(1938)及其补编(1960),90年代以后资料的查询则多利用各种网络资源。本数据库填补了50年代至90年代之间的空白,它主要涵盖中国大陆学者1949-1990年间发表的植物系统学文献,内容包括作者姓名、论着题目及发表书刊等。本库资料主要来源于《中国植物系统学文献要览》(陈心启等1993,广东科技出版社)。目前数据库记录数:6879条
8)标本采集地新旧地名对照数据库
在我国,二十世纪初以前标本采集地的名称,现今常有改变而不再使用。在这种情形下,很有必要通过对旧时和现在地图的核对及参考相关采集资料,来制作新旧地名对照表,建立新旧地名数据库,包括旧地名的经纬度数据,以供标本查询及分类学研究之用。我们根据中国植物分类学家研究经验,总结出包括11个省(市)2000多条采集地新旧地名对照记录。每个旧地名尽可能包括其旧外文名、位置(经纬度),并标明该地名在现今县级行政区的名称、国家标准代码和经纬度。目前数据库记录数:2048条
9)中国植物标本馆数据库
本数据库信息基本于《中国植物标本馆索引》(傅立国等,1993)一书,共收录全国300余家标本馆,并于最近对其中几十家主要标本馆信息进行了更新。每家标本馆信息包括标本馆名称和地址、联系人及联系方法,馆藏特色及收藏目标,以及主要研究人员信息等。
5.植物鉴定指南性资料
本部分数据库包括交互式检索表(又称电子检索表)和植物形态术语图说等,目的是为用户提供从植物特征识别和标本鉴定,到上述的标本及图像比对,一直到物种形态特征描述和国内分布等一站式服务。
1)电子检索表
这是一种互动的计算机程序,使用者不断地向这个程序里输入标本或活植物的性状,那些不具有这些性状的分类群将被排除掉,直到只剩下一个分类单元。它是系统植物学、生物编目与保护的一种非常好的鉴定工具。本检索表提供检索中国种子植物270余个科的电子路径。
2)科属词典数据库
该库转接自成员单位网站,其信息来自侯宽昭主编、吴德邻等人修订的《中国种子植物科属词典》(第二版),共收集我国种子植物276科,3109属,重点描述我国种子植物的科、属形态、地理分布、属种统计、主要经济用途等。该书是我国植物学专业书籍销量最大的图书。其电子词典制作的目的是为了方便用户对植物多样性学信息的获取。
3)“植物鉴定和描述形态术语图解”数据库
包括种子植物形态术语1133条,涵盖了植物鉴定和描述所使用的绝大部分术语,涉及根、茎、叶、花、花序、果实等植物器官。每个条目包括中、英文术语及其中英文释义四部分内容。选词标准规范,释义准确、简明扼要,大部分术语还配有一至多幅精美的线描图(共1297幅),图画特征明显,对于读者理解术语的含义大有裨益。本库资料主要来源于Harris & Harris 1994, Plant Identification Terminology :An Illustrated Glossary (王宇飞等人译,2001. 科学出版社)一书。
4)“国家重点保护野生植物名录(第一、二批)”数据库
第一批名录已于一九九九年发布执行,第二批名录经数年讨论仍未正式发布,但已基本拟定,故一并列出,供用户参考。两个名录共计约1900种(其中兰科植物约占2/3)。该库可查询到植物名称(中名、学名)、科名、批次及保护等级、国内分布(到省级)、海拔高度等信息。
6.科普及孢子植物栏目(分馆)
1)苔藓植物分馆和蕨类植物分馆
两者均分列中国植物名录、植物志、名词解释、植物照片、专家介绍及学科通讯等相关资料,利于专门用户查访。
2)科普分馆
主要是基于植物物种多样性开发的科学普及常识。其中 “标本馆常规技术”和“常用药用植物”两个栏目是我们特地为“中国数字植物标本馆”所编写的。前者包括“标本采集和压制”、“标本装订”、“用检索表鉴定植物”和“植物名称知识介绍”等标本馆常用的专业技术;后者则选录了全国范围内常药用植物百余种加于介绍。每种内容包括名称、来源、原植物形态特征及功能主治等。每种植物还配有一幅精美的彩色图画。
此外“中国数字植物标本馆”还辟有“网站建设介绍”、“信息反馈”和“相关网站”等栏目,其宗旨是为用户提供全面而便捷的信息服务。

‘伍’ 地质遗迹资源和重要古生物化石调查

一、部署重点

开展广西区、贵州省、上海市、江西省、湖南省、广东省、海南省、湖北省、安徽省、江苏省、北京市、河北省、山东省、天津市、新疆区、内蒙古区、甘肃省、宁夏区、西藏区、青海省、黑龙江省、吉林省、辽宁省、陕西省、山西省等25省(市、区)地质遗迹调查。全面完成全国省(市、区)地质遗迹调查工作。

开展全国重要古生物化石产地调查。

开展全国地质遗迹资源区划研究、全国地质遗迹保护规划研究、全国重要地质遗迹调查集成与综合研究,编制全国地质遗迹资源分布系列图,建设全国地质遗迹调查数据库。

开展古生物化石保护名录研究、古生物化石保护区划研究,编制古生物化石保护区划图,建设全国地质遗迹数据库。

二、部署建议

1.工作现状

目前全国已批准182个国家地质公园用于开展地质遗迹保护工作,已建成的国家地质公园有127个,省级地质公园78个。已有部分单位和部门完成了《华东地区重要地质遗迹登录、鉴评与保护研究》、《地质遗迹管理信息数据库》、《全国重点地区地质遗迹区划》等成果。全国已有包括安徽、湖南、新疆、山西、江苏、江西等12省(区)进行地质遗迹初步调查和保护规划研究的探索性工作;完成了《重要地质遗迹调查技术要求》初稿编制。但现有调查,一是覆盖面不够、深度不够、缺乏系统性;二是缺乏科学统一的技术规范与评价体系;三是缺少全国性的地质遗迹保护与利用规划和区域性规划。

2.工作目标

总体目标:在“十二五”期间全面完成全国地质遗迹和重要古生物化石的调查工作,全面了解其分布特征、重要价值,保护现状和开发利用潜力。完成全国各省(市、自治区)地质遗迹资源调查报告、地质遗迹资源数据库;完成全国各省(市、自治区)重要古生物化石调查报告、重要古生物化石产地数据库;编制全国地质遗迹资源分布系列图、重要古生物化石产地分布系列图;提交《全国地质遗迹资源区划》和《重要古生物化石产地保护规划》。

对全国地质剖面类、地质地貌类和地质灾害类地质遗迹进行汇总分析和统计,研究其分布特点、科学研究价值、主要成因及保护开发利用现状;调查重要古生物化石产地的分布和保护现状,建立古生物保护名录;建立全国地质遗迹管理数据库和重要古生物化石产地数据库;编制全国地质遗迹和重要古生物化石产地分布图;开展全国地质遗迹资源区划和重要古生物化石产地保护规划研究工作,为地质遗迹保护和开发利用提供技术基础支撑。

3.工作任务

开展各省地质遗迹资源和重要古生物化石调查,查明地质遗迹资源和重要古生物化石资源状况、分布特征和重要价值,了解其保护和开发利用现状;在各省调查工作的基础上,开展综合研究工作,编制全国地质遗迹资源分布系列图和重要古生物化石产地分布图,建立地质遗迹和重要古生物化石管理数据库;开展全国地质遗迹资源区划和重要古生物化石产地保护规划研究,建立古生物化石保护名录,编制古生物化石保护区划和全国地质遗迹资源区划。

分省级和全国两个层次开展调查与研究。通过示范区调查,统一调查评价技术要求,逐步开展省级地质遗迹资源调查与保护规划工作。在此基础上开展全国地质遗迹资源区划和重要古生物化石产地保护方案规划研究,为省和国家地质遗迹资源和重要古生物化石的管理、保护与开发利用提供技术支撑。

开展全国29省(市、区)地质遗迹调查。制定技术要求和项目管理办法;开展重要地区的重要地质遗迹调查研究工作;开展区划研究和保护规划研究。

‘陆’ 对于古生物化石档案登记和数据库管理,国土资源部与地方各级相关单位的职责各是什么

《古生物化石保护条例》和《古生物化石保护条例实施办法》中明确规定,古生物化石收藏单位应当建立古生物化石档案,并将本单位收藏的重点保护古生物化石档案报所在地的县级以上人民政府国土资源主管部门备案。古生物化石收藏单位应当在档案中如实对本单位收藏的古生物化石作出描述和标注,并根据收藏情况变化及时对档案作出变更。古生物化石收藏单位对本单位的古生物化石档案的真实性负责。

《古生物化石保护条例》第21条规定,国土资源部负责制定古生物化石档案和数据库建设标准,建立和管理全国的重点保护古生物化石档案和数据库。

县级以上地方人民政府国土资源主管部门负责建立和管理本行政区域的重点保护古生物化石档案和数据库。收藏单位法定代表人变更时,应当办理本单位收藏的古生物化石档案移交手续,并在县级以上地方国土资源主管部门备案。此外,《古生物化石保护条例实施办法》第30条还要求省级国土资源主管部门负责登记个人手中收藏的重点保护古生物化石,并纳入本行政区域内的古生物化石档案和数据库。

热点内容
方舟编译器厂家 发布:2024-11-28 04:13:15 浏览:979
android源码编辑 发布:2024-11-28 04:12:38 浏览:596
两路服务器是什么意思 发布:2024-11-28 03:39:39 浏览:937
sql精简版64 发布:2024-11-28 03:36:28 浏览:73
金立怎么加密图片 发布:2024-11-28 03:31:43 浏览:664
2017玩dnf电脑什么配置 发布:2024-11-28 03:30:56 浏览:520
ftp挂载存储ip配置 发布:2024-11-28 03:28:51 浏览:963
山耐斯空压机密码多少 发布:2024-11-28 03:26:28 浏览:405
安卓拍照摇一摇是什么软件 发布:2024-11-28 03:26:27 浏览:257
小米2s存储卡 发布:2024-11-28 03:15:49 浏览:649