当前位置:首页 » 操作系统 » 科普数据库

科普数据库

发布时间: 2023-08-14 01:21:10

A. 中国知网可以查到什么

服务内容
1 、中国知识资源总库
提供CNKI源数据库、外文类、工业类、农业类、医药卫生类、经济类和教育类多种数据库。其中综合性数据库为中国期刊全文数据库、中国博士学位论文数据库、中国优秀硕士学位论文全文数据库、中国重要报纸全文数据库和中国重要会议文论全文数据库。每个数据库都提供初级检索、高级检索和专业检索三种检索功能。高级检索功能最常用。
2、 数字出版平台
数字出版平台是国家“十一五”重点出版工程。数字出版平台提供学科专业数字图书馆和行业图书馆。个性化服务平台由个人数字图书馆、机构数字图书馆、数字化学习平台等。
3、文献数据评价
2010年推出的《中国学术期刊影响因子年报》在全面研究学术期刊、博硕士学位论文、会议论文等各类文献对学术期刊文献的引证规律基础上,研制者首次提出了一套全新的期刊影响因子指标体系,并制定了我国第一个公开的期刊评价指标统计标准----《<中国学术期刊影响因子年报>数据统计规范》。一系列全新的影响因子指标体系,全方位提升了各类计量指标的客观性和准确性。研制单位还出版了“学术期刊各刊影响力统计分析数据库”和“期刊管理部门学术期刊影响力统计分析数据库”,统称为《中国学术期刊影响因子年报》系列数据库。该系列数据库的研制出版旨在客观、规范地评估学术期刊对科研创新的作用,为学术期刊提高办刊质量和水平提供决策参考。“学术期刊个刊影响力评价分析数据库”为各刊提供所发论文的学科分布、出版时滞分布与内容质量分析,并支持论文作者分析、审稿人工作绩效分析等功能,有助于编辑部科学地调整办刊方向与出版策略。 “学术期刊评价指标分析数据库”为期刊出版管理部门和主办单位等分析评价学术期刊学科与研究层次类型布局、期刊内容特点与质量、各类期刊发展走势等管理工作提供决策参考。
4、 知识检索
提供以下检索服务:
文献搜索
精确完整的搜索结果、独具特色的文献排序与聚类,是您科研的得力助手 学术定义写论文需要引用权威的术语定义怎么办?CNKI学术定义搜索帮您轻松解决
数字搜索
“一切用数字说话”,CNKI数字搜索让您的工作、生活、学习和研究变得简单而明白 学术趋势 关注学术热点,展示学术发展历程,发现经典文献,尽在CNKI学术趋势
翻译助手
文献、术语中英互译的好帮手,词汇句子段落应有尽有 新概念。和您分享我们自动发现学术新概念
图形搜索
各专业珍贵的学术图片,研究成果和复杂流程的直观展现 表格搜索 各专业珍贵的学术图表,为您汇总、对比各类信息数据提供方便
专业主题
168个专业主题数字图书馆,各领域学者均有属于自己的专业知识搜索引擎大众热点特色热点话题,帮您了解大众关心的热点知识
学术资源
全面的学术资源网站导航 红楼梦 三国演义水浒传
学术统计分析
对学术文献进行绩效评价及统计分析

B. 请问中国最有影响力的数据库是哪个ISTIC、CNKI、维普

“中国知网”是集知识资源大规模整合出版、原创性学术文献出版、多媒体出版和专业化、个性化数字图书馆为一体的数字出版平台,全面整合了我国90%以上的学术文献和海外重要的学术文献数据库资源,文献类型包括:学术期刊、博士学位论文、优秀硕士学位论文、工具书、 重要会议论文、年鉴、专着、报纸、专利、标准、科技成果、知识元、哈佛商业评论数据库、古籍等;以网络出版和数字图书馆相结合的巨大优势,实现了知识资源的增值服务和学术文献的个性化与专业化的实时出版,面向全社会各行各业创新与创新管理提供知识管理服务。目前,《中国知识资源总库》中的各类文献资源已推广至海内外高等院校、政府、企事业单位、医疗卫生机构、情报服务机构以及农村等各个领域,带动了学术资源在党政领导机关管理决策、基础教育改革、城乡社区公共知识服务、农村文化建设中的大量普及与应用,产生了良好的社会效益和经济效益。为我国数字与网络出版产业的高速发展和国际化奠定了重要的基础。
CNKI工程
中国知识基础设施工程(China National Knowledge Infrastructure),简称CNKI工程,始建于1995年,是以实现全社会知识信息资源传播共享与增值利用为目标的国家信息化重点工程,由清华大学发起,同方知网技术产业集团承担建设,是“十一五”国家重大出版工程项目。
在党和国家领导以及教育部、中宣部、科技部、新闻出版总署、国家版权局、国家计委的大力支持下,在全国学术界、教育界、出版界、图书情报界等社会各界的密切配合和清华大学的直接领导下,同方知网技术产业集团经过多年努力,采用自主开发并具有国际领先水平的数字图书馆技术,建成了超大型全文数据库《中国知识资源总库》,以“中国知网(www.cnki.net)”为网络出版与知识服务平台,通过产业化运作,为全社会知识资源高效共享提供丰富的知识信息资源和有效的知识传播与数字化学习平台。
“中国知网”的数字出版产品总称为《中国知识资源总库》,是一个采用符合国际、国家和行业技术标准的CNKI网络出版产品与技术服务标准,对各种文献资源进行规范化、标准化加工和集成化整合而成的超大型全文数据库。
其中,国家重点出版项目---《中国学术文献网络出版总库》,遵循“权威性文献检索工具、集成化增值性整合传播媒体、数字化学习与研究平台、智能化专业知识仓库、规范化学术文献与科研绩效评价工具、可二次开发的数字化资源战略馆藏”六大建设标准,按照知识网络建构模式,大规模集成整合了我国学术期刊、博硕士学位论文、会议论文、报纸、年鉴、工具书、学术图书、专利、标准、科技成果等各类文献资源,内容涵盖各学科、各行业领域,囊括基础研究、工程技术、高级科普、政策指导、行业指导、实用技术、职业指导、科技信息等各个层面,连续累积出版文献5600多万篇,并大量整合了互联网上外文科技资源。此外,《中国知识资源总库》还收录出版了大量高等教育、基础教育、党建、大众科普、政策法规、经济信息、大众文化、文艺作品类文献。尤其是基于《总库》的行业、专业与个性化数字图书馆,融合了各类先进的知识服务模式,为高效率创新、学习和管理决策创造了理想的信息化环境。

不管怎么样,有你自己需要的东西才是最实在的,来龙去脉没有必要搞清楚。

C. 中国植物数据库的介绍

中国科学院植物研究所长期开展的植物信息工程建设项目,该项目将国内植物研究信息、植物调查信息、植物经济和社会应用信息以计算机技术收集整理建立各种形式数据库。其目的旨在对植物调查研究和经济利用在信息积累方面进行总结,并为植物科学研究、经济利用、园林建设、生态旅游、科普教育、环境和植物保护服务。中国植物数据库建库内容包括植物基本信息、经济利用信息、分类系统研究信息、专题研究信息和植物图像信息,以及与数据库建设和服务有关的程序软件;当前数据库已包括5529种(包括种下分类单位)植物信息,总信息量达到4620MB。上世纪90年代以后数据库建设重点转向植物图像,今后五至十年将初步建成中国植物图像库,进一步补充完善植物基本信息和其它植物考察利用信息,开发多功能的数据分析应用软件,更好地发挥植物数据库的服务应用水平。

D. 中国数字植物标本馆的数据库

1.标本信息
提供成员单位标本馆所完成的数字化标本信息,包括一般标本及模式标本。每份标本信息包括标签信息及图像信息,前者包括标本采集人、采集日期、地点、生境与海拔以及鉴定信息和标本存放地点(标本馆)等。
目前在CVH网上能查询到中科院系统13家标本馆标本,共计二百八十五万份(笔)标本信息及一百五十五万张标本图像,缺乏图像的记录已在首页予以标明。
网上模式标本6500份,仅包括中科院植物所标本馆馆藏的模式标本,包括裸子植物、毛茛科、荨麻科、山茶科、壳斗科等类群。信息均经过核实,还附有发表新种的原始文献(PDF格式)以及高分辨率标本图像。
分布式标本信息检索系统:目前CVH的标本信息是通过集中式实现共享查询的,其主要缺陷是更新周期长,存储压力大。我们正在试验的分布式标本信息查询系统已有5家标本馆(称CVH分馆)参与,共有100多万份标本信息实现实时更新,并由成员单位通过FTP自主管理其分馆,有效地发挥成员单位的积极性。
2.《中国植物志》数据库
包括全套《中国植物志》79卷(除第一卷外)125册图书的PDF文件,可通过科名和植物名称(学名、中名)查询到志书文字及图版。最近完成的检索文件复核补充工作使数据库更全面准确地反映植物志的内容,除正名(accepted name)外,讨论部分的学名也可查到。数据库记录数:45000余条。
3.彩色图库
上传到CVH网站上的植物彩色照片共计五万余张,属于269科5700种,为近年来众多志愿者自野外拍摄所得,范围涉及在全国34个省(区、市)的野生植物。下阶段将逐步建立彩图鉴定专家系统,以提高照片鉴定准确性。
至此,用户输入学名或中名可关联性查询到标本、植物志及彩色图片三大数据库,这也是CVH的主要数据库。
4.其他相关数据库
为方便用户使用标本信息,“中国数字植物标本馆”网站还提供其他大量相关的(植物学)数据库,如标本采集地名与标本馆数据、分类研究人员及其研究论文题录等。这些数据库或源自实际工作经验的总结、或直接转自权威工具书并经过专家审核。
1)《中国高等植物图鉴》数据库
为该书全套五册正编及两册补编共7本书的全文检索。可通过科名和植物名称(学名及中名)查询到书中正文文字及图画。数据库记录数:9057条。
2)地方植物志及其统一查询
提供12套地方志的数字化文挡(PDF文件),可通过统一关联查询任何1-12种植物志信息,包括西藏、秦岭、辽宁、贵州、浙江、海南等省(区/市)及地区植物志。下阶段计划实现《中国植物志》与地方植物志的关联查询。数据库记录数:47112条。
3) “三种主要志书属名数据库”
提供查询中国维管植物属名在《中国植物志》、《中国高等植物图鉴》和FLORA OF CHINA中的位子,包括卷册及页码。这三套志书(图鉴)是目前研究中国植物的主要参考书。该数据库的复核工作已于最近完成,增加了新近出版 FLORA OF CHINA卷册内容,并修改(修订)数百条记录,使数据更准确全面。数据库记录数:3504条。
4)植物名称及分布数据库
通过该库可以快速查询到中国种子植物名称及分布信息(到省级)等简单信息。资料主要来源于《中国植物志》和 已出版的Flora of China,可以认为是《中国植物志》的名录修订。目前数据库记录数:34056条。
5)模式标本名录及其原始文献数据库
该数据库以收集中国原生植物(Native plant)名称模式标本及其发表原始文献资料为宗旨,无论其模式标本采集地及保藏地在国内或国外、该名称何时于何种刊物发表都尽量予以收录。每条记录包括植物名称(学名、中名)、发表刊物,模式标本采集地点和生境、年代及标本采集人和采集号,以及标本存放地点(标本馆)。大部分资料以外文形式出现。数据库资料来源于国内外多种书刊,其中标本馆代码依 Holmgren et al.1990. Index Herbariorum和傅立国等1993《中国植物标本馆索引》(中国科技出版社)。缩写代号HT: Holotype, IT: Isotype, T: Type。目前数据库记录数:30705条
6)植物名称作者(命名人)数据库
据统计,至今为止,中国植物命名作者多达五千余人,其中命名两个及两个以上名称的有近3500人。本数据库就是基于这3500人的资料建立的,每条记录包括作者全名及标准缩写、工作/出生/生卒年代、专长类群等。中国作者(共919条目)还附有中文名及工作单位。本数据库依据国内外多种书刊资料编辑而成,其中人名拼写标准主要依据Brummitt & Powell 1992, Authors of Plant Names。类群代码为:A:藻类;B:苔藓;C:孢子植物;F:化石植物;M:真菌和地衣;P:蕨类;S:种子植物。目前数据库记录数:3481条。
7)中国植物分类学文献要览(1949-1990)
一般地,查询20世纪50年代以前中国植物学文献时可查询E.D.Merrill & E.H.Walker 《东亚植物学文献目录》(1938)及其补编(1960),90年代以后资料的查询则多利用各种网络资源。本数据库填补了50年代至90年代之间的空白,它主要涵盖中国大陆学者1949-1990年间发表的植物系统学文献,内容包括作者姓名、论着题目及发表书刊等。本库资料主要来源于《中国植物系统学文献要览》(陈心启等1993,广东科技出版社)。目前数据库记录数:6879条
8)标本采集地新旧地名对照数据库
在我国,二十世纪初以前标本采集地的名称,现今常有改变而不再使用。在这种情形下,很有必要通过对旧时和现在地图的核对及参考相关采集资料,来制作新旧地名对照表,建立新旧地名数据库,包括旧地名的经纬度数据,以供标本查询及分类学研究之用。我们根据中国植物分类学家研究经验,总结出包括11个省(市)2000多条采集地新旧地名对照记录。每个旧地名尽可能包括其旧外文名、位置(经纬度),并标明该地名在现今县级行政区的名称、国家标准代码和经纬度。目前数据库记录数:2048条
9)中国植物标本馆数据库
本数据库信息基本于《中国植物标本馆索引》(傅立国等,1993)一书,共收录全国300余家标本馆,并于最近对其中几十家主要标本馆信息进行了更新。每家标本馆信息包括标本馆名称和地址、联系人及联系方法,馆藏特色及收藏目标,以及主要研究人员信息等。
5.植物鉴定指南性资料
本部分数据库包括交互式检索表(又称电子检索表)和植物形态术语图说等,目的是为用户提供从植物特征识别和标本鉴定,到上述的标本及图像比对,一直到物种形态特征描述和国内分布等一站式服务。
1)电子检索表
这是一种互动的计算机程序,使用者不断地向这个程序里输入标本或活植物的性状,那些不具有这些性状的分类群将被排除掉,直到只剩下一个分类单元。它是系统植物学、生物编目与保护的一种非常好的鉴定工具。本检索表提供检索中国种子植物270余个科的电子路径。
2)科属词典数据库
该库转接自成员单位网站,其信息来自侯宽昭主编、吴德邻等人修订的《中国种子植物科属词典》(第二版),共收集我国种子植物276科,3109属,重点描述我国种子植物的科、属形态、地理分布、属种统计、主要经济用途等。该书是我国植物学专业书籍销量最大的图书。其电子词典制作的目的是为了方便用户对植物多样性学信息的获取。
3)“植物鉴定和描述形态术语图解”数据库
包括种子植物形态术语1133条,涵盖了植物鉴定和描述所使用的绝大部分术语,涉及根、茎、叶、花、花序、果实等植物器官。每个条目包括中、英文术语及其中英文释义四部分内容。选词标准规范,释义准确、简明扼要,大部分术语还配有一至多幅精美的线描图(共1297幅),图画特征明显,对于读者理解术语的含义大有裨益。本库资料主要来源于Harris & Harris 1994, Plant Identification Terminology :An Illustrated Glossary (王宇飞等人译,2001. 科学出版社)一书。
4)“国家重点保护野生植物名录(第一、二批)”数据库
第一批名录已于一九九九年发布执行,第二批名录经数年讨论仍未正式发布,但已基本拟定,故一并列出,供用户参考。两个名录共计约1900种(其中兰科植物约占2/3)。该库可查询到植物名称(中名、学名)、科名、批次及保护等级、国内分布(到省级)、海拔高度等信息。
6.科普及孢子植物栏目(分馆)
1)苔藓植物分馆和蕨类植物分馆
两者均分列中国植物名录、植物志、名词解释、植物照片、专家介绍及学科通讯等相关资料,利于专门用户查访。
2)科普分馆
主要是基于植物物种多样性开发的科学普及常识。其中 “标本馆常规技术”和“常用药用植物”两个栏目是我们特地为“中国数字植物标本馆”所编写的。前者包括“标本采集和压制”、“标本装订”、“用检索表鉴定植物”和“植物名称知识介绍”等标本馆常用的专业技术;后者则选录了全国范围内常药用植物百余种加于介绍。每种内容包括名称、来源、原植物形态特征及功能主治等。每种植物还配有一幅精美的彩色图画。
此外“中国数字植物标本馆”还辟有“网站建设介绍”、“信息反馈”和“相关网站”等栏目,其宗旨是为用户提供全面而便捷的信息服务。

E. sinomed系统涵盖的数据库有哪些

中国生物医学文献服务系统(SinoMed)是由中国医学科学院医学信息研究所/图书馆开发研制。包括以下几个子库:
(1)中国生物医学文献数据库(CBM):收录1978以来1600余种中国生物医学期刊,以及汇编、会议论文的文献题录770余万篇,全部题录均进行主题标引和分类标引等规范化加工处理。年增文献40余万篇,每月更新。 部分论文可直接链接到维普中文科技期刊全文库获取全文。
(2)中国医学科普文献数据库:收录2000年以来国内出版的医学科普期刊近百种,文献总量近25万篇,重点突显养生保健、心理健康、生殖健康、运动健身、医学美容、婚姻家庭、食品营养等与医学健康有关的内容。每月更新。可浏览全文。
(3)北京协和医学院博硕学位论文库:收录1981年以来协和医学院培养的博士、硕士研究生学位论文9700余篇,学科范围涉及医学、药学各专业领域及其他相关专业,内容前沿、丰富,可在线浏览全文。每季更新。可以在线浏览和下载文摘信息。在题录页面点击“原文阅读”可以在线阅读全文。提示:全文不提供下载!
(4)西文生物医学文献数据库(WBM):收录目前世界各国出版的7200余种重要生物医学期刊文献题录2286万余篇,其中协和医学院图书馆馆藏期刊4800余种,免费期刊2400余种。部分期刊可回溯至创刊年,全面体现协和医学院图书馆悠久丰厚的历史馆藏。年增文献60余万篇,每月更新。
(5)英文文集汇编文摘数据库:收录协和医学院图书馆馆藏生物医学文集、汇编以及能够从中析出单篇文献的各种参考工具书等240余种/册,文献量共计38700余篇。报道内容以最新出版的文献为主,部分文献可回溯至2000年。每月更新。
(6)英文会议文摘数据库:收录2000年以来世界各主要协会、出版机构的60余种生物医学学术会议文献,部分文献有少量回溯,文献量共计16540余篇。每月更新。
(7)俄文生物医学文献数据库:收录1995年以来俄国出版的俄文重要生物医学学术期刊30余种,部分期刊有少量回溯,文献量共计10420余篇。每月更新。
(8)日文生物医学文献数据库:收录1995年以来日本出版的日文重要生物医学学术期刊90余种,部分期刊有少量回溯,文献量共计76240余篇。每月更新。

F. 数据库 名词解释

数据库的概念:

数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于距今六十多年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后,

数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。

在信息化社会,充分有效地管理和利用各类信息资源,是进行科学研究和决策管理的前提条件。数据库技术是管理信息系统、办公自动化系统、决策支持系统等各类信息系统的核心部分,是进行科学研究和决策管理的重要技术手段。

数据库的定义:

定义1:数据库(Database)是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。

简单来说是本身可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、截取、更新、删除等操作。

在经济管理的日常工作中,常常需要把某些相关的数据放进这样的“仓库”,并根据管理的需要进行相应的处理。

例如,企业或事业单位的人事部门常常要把本单位职工的基本情况(职工号、姓名、年龄、性别、籍贯、工资、简历等)存放在表中,这张表就可以看成是一个数据库。有了这个"数据仓库"我们就可以根据需要随时查询某职工的基本情况,也可以查询工资在某个范围内的职工人数等等。这些工作如果都能在计算机上自动进行,那我们的人事管理就可以达到极高的水平。此外,在财务管理、仓库管理、生产管理中也需要建立众多的这种"数据库",使其可以利用计算机实现财务、仓库、生产的自动化管理。

定义2:

严格来说,数据库是长期储存在计算机内、有组织的、可共享的数据集合。数据库中的数据指的是以一定的数据模型组织、描述和储存在一起、具有尽可能小的冗余度、较高的数据独立性和易扩展性的特点并可在一定范围内为多个用户共享。

这种数据集合具有如下特点:尽可能不重复,以最优方式为某个特定组织的多种应用服务,其数据结构独立于使用它的应用程序,对数据的增、删、改、查由统一软件进行管理和控制。从发展的历史看,数据库是数据管理的高级阶段,它是由文件管理系统发展起来的。[1] [2]

数据库的处理系统:

数据库是一个单位或是一个应用领域的通用数据处理系统,它存储的是属于企业和事业部门、团体和个人的有关数据的集合。数据库中的数据是从全局观点出发建立的,按一定的数据模型进行组织、描述和存储。其结构基于数据间的自然联系,从而可提供一切必要的存取路径,且数据不再针对某一应用,而是面向全组织,具有整体的结构化特征。

数据库中的数据是为众多用户所共享其信息而建立的,已经摆脱了具体程序的限制和制约。不同的用户可以按各自的用法使用数据库中的数据;多个用户可以同时共享数据库中的数据资源,即不同的用户可以同时存取数据库中的同一个数据。数据共享性不仅满足了各用户对信息内容的要求,同时也满足了各用户之间信息通信的要求。

数据库的基本结构:

数据库的基本结构分三个层次,反映了观察数据库的三种不同角度。

以内模式为框架所组成的数据库叫做物理数据库;以概念模式为框架所组成的数据叫概念数据库;以外模式为框架所组成的数据库叫用户数据库。

⑴ 物理数据层。

它是数据库的最内层,是物理存贮设备上实际存储的数据的集合。这些数据是原始数据,是用户加工的对象,由内部模式描述的指令操作处理的位串、字符和字组成。

⑵ 概念数据层。

它是数据库的中间一层,是数据库的整体逻辑表示。指出了每个数据的逻辑定义及数据间的逻辑联系,是存贮记录的集合。它所涉及的是数据库所有对象的逻辑关系,而不是它们的物理情况,是数据库管理员概念下的数据库。

⑶ 用户数据层。

它是用户所看到和使用的数据库,表示了一个或一些特定用户使用的数据集合,即逻辑记录的集合。

数据库不同层次之间的联系是通过映射进行转换的。

数据库的主要特点:

⑴ 实现数据共享

数据共享包含所有用户可同时存取数据库中的数据,也包括用户可以用各种方式通过接口使用数据库,并提供数据共享。

⑵ 减少数据的冗余度

同文件系统相比,由于数据库实现了数据共享,从而避免了用户各自建立应用文件。减少了大量重复数据,减少了数据冗余,维护了数据的一致性。

⑶ 数据的独立性

数据的独立性包括逻辑独立性(数据库中数据库的逻辑结构和应用程序相互独立)和物理独立性(数据物理结构的变化不影响数据的逻辑结构)。

⑷ 数据实现集中控制

文件管理方式中,数据处于一种分散的状态,不同的用户或同一用户在不同处理中其文件之间毫无关系。利用数据库可对数据进行集中控制和管理,并通过数据模型表示各种数据的组织以及数据间的联系。

⑸数据一致性和可维护性,以确保数据的安全性和可靠性

主要包括:①安全性控制:以防止数据丢失、错误更新和越权使用;②完整性控制:保证数据的正确性、有效性和相容性;③并发控制:使在同一时间周期内,允许对数据实现多路存取,又能防止用户之间的不正常交互作用。

⑹ 故障恢复

由数据库管理系统提供一套方法,可及时发现故障和修复故障,从而防止数据被破坏。数据库系统能尽快恢复数据库系统运行时出现的故障,可能是物理上或是逻辑上的错误。比如对系统的误操作造成的数据错误等。

数据库的数据种类:

数据库通常分为层次式数据库、网络式数据库和关系式数据库三种。而不同的数据库是按不同的数据结构来联系和组织的。

1.数据结构模型

⑴数据结构

所谓数据结构是指数据的组织形式或数据之间的联系。

如果用D表示数据,用R表示数据对象之间存在的关系集合,则将DS=(D,R)称为数据结构。

例如,设有一个电话号码簿,它记录了n个人的名字和相应的电话号码。为了方便地查找某人的电话号码,将人名和号码按字典顺序排列,并在名字的后面跟随着对应的电话号码。这样,若要查找某人的电话号码(假定他的名字的第一个字母是Y),那么只须查找以Y开头的那些名字就可以了。该例中,数据的集合D就是人名和电话号码,它们之间的联系R就是按字典顺序的排列,其相应的数据结构就是DS=(D,R),即一个数组。

⑵数据结构类型

数据结构又分为数据的逻辑结构和数据的物理结构。

数据的逻辑结构是从逻辑的角度(即数据间的联系和组织方式)来观察数据,分析数据,与数据的存储位置无关;数据的物理结构是指数据在计算机中存放的结构,即数据的逻辑结构在计算机中的实现形式,所以物理结构也被称为存储结构。

这里只研究数据的逻辑结构,并将反映和实现数据联系的方法称为数据模型。

比较流行的数据模型有三种,即按图论理论建立的层次结构模型和网状结构模型以及按关系理论建立的关系结构模型。

2.层次、网状和关系数据库系统

⑴层次结构模型

层次结构模型实质上是一种有根结点的定向有序树(在数学中"树"被定义为一个无回的连通图)。下图是一个高等学校的组织结构图。这个组织结构图像一棵树,校部就是树根(称为根结点),各系、专业、教师、学生等为枝点(称为结点),树根与枝点之间的联系称为边,树根与边之比为1:N,即树根只有一个,树枝有N个。

按照层次模型建立的数据库系统称为层次模型数据库系统。IMS(Information Management System)是其典型代表。

⑵网状结构模型

按照网状数据结构建立的数据库系统称为网状数据库系统,其典型代表是DBTG(Database Task Group)。用数学方法可将网状数据结构转化为层次数据结构。

⑶ 关系结构模型

关系式数据结构把一些复杂的数据结构归结为简单的二元关系(即二维表格形式)。例如某单位的职工关系就是一个二元关系。

由关系数据结构组成的数据库系统被称为关系数据库系统。

在关系数据库中,对数据的操作几乎全部建立在一个或多个关系表格上,通过对这些关系表格的分类、合并、连接或选取等运算来实现数据的管理。

dBASEⅡ就是这类数据库管理系统的典型代表。对于一个实际的应用问题(如人事管理问题),有时需要多个关系才能实现。用dBASEⅡ建立起来的一个关系称为一个数据库(或称数据库文件),而把对应多个关系建立起来的多个数据库称为数据库系统。dBASEⅡ的另一个重要功能是通过建立命令文件来实现对数据库的使用和管理,对于一个数据库系统相应的命令序列文件,称为该数据库的应用系统。

因此,可以概括地说,一个关系称为一个数据库,若干个数据库可以构成一个数据库系统。数据库系统可以派生出各种不同类型的辅助文件和建立它的应用系统。

数据库的发展简史:

1 数据库的技术发展

使用计算机后,随着数据处理量的增长,产生了数据管理技术。数据管理技术的发展与计算机硬件(主要是外部存储器)系统软件及计算机应用的范围有着密切的联系。数据管理技术的发展经历了以下四个阶段:人工管理阶段、文件系统阶段、数据库阶段和高级数据库技术阶段 。

2 数据管理的诞生

数据库的历史可以追溯到五十年前,那时的数据管理非常简单。通过大量的分类、比较和表格绘制的机器运行数百万穿孔卡片来进行数据的处理,其运行结果在纸上打印出来或者制成新的穿孔卡片。而数据管理就是对所有这些穿孔卡片进行物理的储存和处理。然而,1950 年雷明顿兰德公司(Remington Rand Inc)的一种叫做Univac I 的计算机推出了一种一秒钟可以输入数百条记录的磁带驱动器,从而引发了数据管理的革命。1956 年IBM生产出第一个磁盘驱动器—— the Model 305 RAMAC。此驱动器有50 个盘片,每个盘片直径是2 英尺,可以储存5MB的数据。使用磁盘最大的好处是可以随机存取数据,而穿孔卡片和磁带只能顺序存取数据。

1951: Univac系统使用磁带和穿孔卡片作为数据存储。

数据库系统的萌芽出现于二十世纪60 年代。当时计算机开始广泛地应用于数据管理,对数据的共享提出了越来越高的要求。传统的文件系统已经不能满足人们的需要,能够统一管理和共享数据的数据库管理系统(DBMS)应运而生。数据模型是数据库系统的核心和基础,各种DBMS软件都是基于某种数据模型的。所以通常也按照数据模型的特点将传统数据库系统分成网状数据库、层次数据库和关系数据库三类。

最早出现的网状DBMS,是美国通用电气公司Bachman等人在1961年开发的IDS(Integrated Data Store)。1964年通用电气公司(General ElectricCo.)的Charles Bachman 成功地开发出世界上第一个网状DBMS也即第一个数据库管理系统——集成数据存储(Integrated Data Store IDS),奠定了网状数据库的基础,并在当时得到了广泛的发行和应用。IDS 具有数据模式和日志的特征,但它只能在GE主机上运行,并且数据库只有一个文件,数据库所有的表必须通过手工编码生成。之后,通用电气公司一个客户——BF Goodrich Chemical 公司最终不得不重写了整个系统,并将重写后的系统命名为集成数据管理系统(IDMS)。

网状数据库模型对于层次和非层次结构的事物都能比较自然的模拟,在关系数据库出现之前网状DBMS要比层次DBMS用得普遍。在数据库发展史上,网状数据库占有重要地位。

层次型DBMS是紧随网络型数据库而出现的,最着名最典型的层次数据库系统是IBM 公司在1968 年开发的IMS(Information Management System),一种适合其主机的层次数据库。这是IBM公司研制的最早的大型数据库系统程序产品。从60年代末产生起,如今已经发展到IMSV6,提供群集、N路数据共享、消息队列共享等先进特性的支持。这个具有30年历史的数据库产品在如今的WWW应用连接、商务智能应用中扮演着新的角色。

1973年Cullinane公司(也就是后来的Cullinet软件公司),开始出售Goodrich公司的IDMS改进版本,并且逐渐成为当时世界上最大的软件公司。

数据库的关系由来:

网状数据库和层次数据库已经很好地解决了数据的集中和共享问题,但是在数据独立性和抽象级别上仍有很大欠缺。用户在对这两种数据库进行存取时,仍然需要明确数据的存储结构,指出存取路径。而后来出现的关系数据库较好地解决了这些问题。

1970年,IBM的研究员E.F.Codd博士在刊物《Communication of the ACM》上发表了一篇名为“A Relational Model of Data for Large Shared Data Banks”的论文,提出了关系模型的概念,奠定了关系模型的理论基础。尽管之前在1968年Childs已经提出了面向集合的模型,然而这篇论文被普遍认为是数据库系统历史上具有划时代意义的里程碑。Codd的心愿是为数据库建立一个优美的数据模型。后来Codd又陆续发表多篇文章,论述了范式理论和衡量关系系统的12条标准,用数学理论奠定了关系数据库的基础。关系模型有严格的数学基础,抽象级别比较高,而且简单清晰,便于理解和使用。但是当时也有人认为关系模型是理想化的数据模型,用来实现DBMS是不现实的,尤其担心关系数据库的性能难以接受,更有人视其为当时正在进行中的网状数据库规范化工作的严重威胁。为了促进对问题的理解,1974年ACM牵头组织了一次研讨会,会上开展了一场分别以Codd和Bachman为首的支持和反对关系数据库两派之间的辩论。这次着名的辩论推动了关系数据库的发展,使其最终成为现代数据库产品的主流。

1969年Edgar F.“Ted” Codd发明了关系数据库。

1970年关系模型建立之后,IBM公司在San Jose实验室增加了更多的研究人员研究这个项目,这个项目就是着名的System R。其目标是论证一个全功能关系DBMS的可行性。该项目结束于1979年,完成了第一个实现SQL的 DBMS。然而IBM对IMS的承诺阻止了System R的投产,一直到1980年System R才作为一个产品正式推向市场。IBM产品化步伐缓慢的三个原因:IBM重视信誉,重视质量,尽量减少故障;IBM是个大公司,官僚体系庞大,IBM内部已经有层次数据库产品,相关人员不积极,甚至反对。

然而同时,1973年加州大学伯克利分校的Michael Stonebraker和Eugene Wong利用System R已发布的信息开始开发自己的关系数据库系统Ingres。他们开发的Ingres项目最后由Oracle公司、Ingres公司以及硅谷的其他厂商所商品化。后来,System R和Ingres系统双双获得ACM的1988年“软件系统奖”。

1976年霍尼韦尔公司(Honeywell)开发了第一个商用关系数据库系统——Multics Relational Data Store。关系型数据库系统以关系代数为坚实的理论基础,经过几十年的发展和实际应用,技术越来越成熟和完善。其代表产品有Oracle、IBM公司的 DB2、微软公司的MS SQL Server以及Informix、ADABAS D等等。

数据库的发展阶段:

数据库发展阶段大致划分为如下的几个阶段:人工管理阶段、文件系统阶段、数据库系统阶段、高级数据库阶段。

人工管理阶段

20世纪50年代中期之前,计算机的软硬件均不完善。硬件存储设备只有磁带、卡片和纸带,软件方面还没有操作系统,当时的计算机主要用于科学计算。这个阶段由于还没有软件系统对数据进行管理,程序员在程序中不仅要规定数据的逻辑结构,还要设计其物理结构,包括存储结构、存取方法、输入输出方式等。当数据的物理组织或存储设备改变时,用户程序就必须重新编制。由于数据的组织面向应用,不同的计算程序之间不能共享数据,使得不同的应用之间存在大量的重复数据,很难维护应用程序之间数据的一致性。

这一阶段的主要特征可归纳为如下几点:

(1)计算机中没有支持数据管理的软件,计算机系统不提供对用户数据的管理功能,应用程序只包含自己要用到的全部数据。用户编制程序,必须全面考虑好相关的数据,包括数据的定义、存储结构以即存取方法等。程序和数据是一个不可分割的整体。数据脱离了程序极具无任何存在的价值,数据无独立性。

(2)数据不能共享。不同的程序均有各自的数据,这些数据对不同的程序通常是不相同的,不可共享;即使不同的程序使用了相同的一组数据,这些数据也不能共享,程序中仍然需要各自加入这组数据,哪个部分都不能省略。基于这种数据的不可共享性,必然导致程序与程序之间存在大量的重复数据,浪费存储空间。

(3)不能单独保存数据。在程序中要规定数据的逻辑结构和物理结构,数据与程序不独立。基于数据与程序是一个整体,数据只为本程序所使用,数据只有与相应的程序一起保存才有价值,否则毫无用处。所以,所有程序的数据不单独保存。数据处理的方式是批处理。

文件系统阶段:

这一阶段的主要标志是计算机中有了专门管理数据库的软件——操作系统(文件管理)。

上世纪50年代中期到60年代中期,由于计算机大容量直接存储设备如硬盘、磁鼓的出现,

推动了软件技术的发展,软件的领域出现了操作系统和高级软件,操作系统中的文件系统是专门管理外存的数据管理软件,操作系统为用户使用文件提供了友好界面。操作系统的出现标志着数据管理步入一个新的阶段。在文件系统阶段,数据以文件为单位存储在外存,且由操作系统统一管理,文件是操作系统管理的重要资源。

文件系统阶段的数据管理具有一下几个特点:

优点

(1)数据以“文件”形式可长期保存在外部存储器的磁盘上。由于计算机的应用转向信息管理,因此对文件要进行大量的查询、修改和插入等操作。

(2)数据的逻辑结构与物理结构有了区别,程序和数据分离,使数据与程序有了一定的独立性,但比较简单。数据的逻辑结构是指呈现在用户面前的数据结构形式。数据的物理结构是指数据在计算机存储设备上的实际存储结构。程度与数据之间具有“设备独立性”,即程序只需用文件名就可与数据打交道,不必关心数据的物理位置。由操作系统的文件系统提供存取方法(读/写)。

(3)文件组织已多样化。有索引文件、链接文件和直接存取文件等。但文件之间相互独立、缺乏联系。数据之间的联系需要通过程序去构造。

(4)数据不再属于某个特定的程序,可以重复使用,即数据面向应用。但是文件结构的设计仍是基于特定的用途,程序基于特定的物理结构和存取方法,因此程度与数据结构之间的依赖关系并未根本改变。

(5)用户的程序与数据可分别存放在外存储器上,各个应用程序可以共享一组数据,实现了以文件为单位的数据共享文件系统。

(6)对数据的操作以记录为单位。这是由于文件中只存储数据,不存储文件记录的结构描述信息。文件的建立、存取、查询、插入、删除、修改等操作,都要用程序来实现。

(7)数据处理方式有批处理,也有联机实时处理。

缺点

文件系统对计算机数据管理能力的提高虽然起了很大的作用,但随着数据管理规模的扩大,数据量急剧增加,文价系统显露出一些缺陷,问题表现在:

(1)数据文件是为了满足特定业务领域某一部门的专门需要而设计,数据和程序相互依赖,数据缺乏足够的独立性。

(2)数据没有集中管理的机制,其安全性和完整性无法保障,数据维护业务仍然由应用程序来承担;

(3)数据的组织仍然是面向程序,数据与程序的依赖性强,数据的逻辑结构不能方便地修改和扩充,数据逻辑结构的每一点微小改变都会影响到应用程序;而且文件之间的缺乏联系,因而它们不能反映现实世界中事物之间的联系,加上操作系统不负责维护文件之间的联系,信息造成每个应用程序都有相对应的文件。如果文件之间有内容上的联系,那也只能由应用程序去处理,有可能同样的数据在多个文件中重复储存。这两者造成了大量的数据冗余。

(4)对现有数据文件不易扩充,不易移植,难以通过增、删数据项来适应新的应用要求。

数据库系统阶段:

20世纪60年代后期,随着计算机在数据管理领域的普遍应用,人们对数据管理技术提出了更高的要求:希望面向企业或部门,以数据为中心组织数据,减少数据的冗余,提供更高的数据共享能力,同时要求程序和数据具有较高的独立性,当数据的逻辑结构改变时,不涉及数据的物理结构,也不影响应用程序,以降低应用程序研制与维护的费用。数据库技术正是在这样一个应用需求的基础上发展起来的。

概括起来,数据库系统阶段的数据管理具有以下几个特点:

(1)采用数据模型表示复杂的数据结构。数据模型不仅描述数据本身的特征,还要描述数据之间的联系,这种联系通过所有存取路径。通过所有存储路径表示自然的数据联系是数据库与传统文件的根本区别。这样,数据不再面向特定的某个或多个应用,而是面对整个应用系统。如面向企业或部门,以数据为中心组织数据,形成综合性的数据库,为各应用共享。

(2)由于面对整个应用系统使得,数据冗余小,易修改、易扩充,实现了数据贡献。不同的应用程序根据处理要求,从数据库中获取需要的数据,这样就减少了数据的重复存储,也便于增加新的数据结构,便于维护数据的一致性。

(3)对数据进行统一管理和控制,提供了数据的安全性、完整性、以及并发控制。

(4)程序和数据有较高的独立性。数据的逻辑结构与物理结构之间的差别可以很大,用户以简单的逻辑结构操作数据而无须考虑数据的物理结构。

(5)具有良好的用户接口,用户可方便地开发和使用数据库。

从文件系统发展到数据库系统,这在信息领域中具有里程碑的意义。在文件系统阶段,人们在信息处理中关注的中心问题是系统功能的设计,因此程序设计占主导地位;而在数据库方式下,数据开始占据了中心位置,数据的结构设计成为信息系统首先关心的问题,而应用程序则以既定的数据结构为基础进行设计。

数据库发展趋势:

随着信息管理内容的不断扩展,出现了丰富多样的数据模型(层次模型,网状模型,关系模型,面向对象模型,半结构化模型等),新技术也层出不穷(数据流,Web数据管理,数据挖掘等)。每隔几年,国际上一些资深的数据库专家就会聚集一堂,探讨数据库研究现状,存在的问题和未来需要关注的新技术焦点。过去已有的几个类似报告包括:1989年Future Directions inDBMS Research-The Laguna BeachParticipants ;1990年DatabaseSystems : Achievements and Opportunities ;1991年W.H. Inmon 发表的《构建数据仓库》;1995年Database。

常见数据库厂商:

1. SQL Server

只能在windows上运行,没有丝毫的开放性,操作系统的系统的稳定对数据库是十分重要的。Windows9X系列产品是偏重于桌面应用,NT server只适合中小型企业。而且windows平台的可靠性,安全性和伸缩性是非常有限的。它不象unix那样久经考验,尤其是在处理大数据库。

2. Oracle

能在所有主流平台上运行(包括 windows)。完全支持所有的工业标准。采用完全开放策略。可以使客户选择最适合的解决方案。对开发商全力支持。

3. Sybase ASE

能在所有主流平台上运行(包括 windows)。 但由于早期Sybase与OS集成度不高,因此VERSION11.9.2以下版本需要较多OS和DB级补丁。在多平台的混合环境中,会有一定问题。

4. DB2

能在所有主流平台上运行(包括windows)。最适于海量数据。DB2在企业级的应用最为广泛,在全球的500家最大的企业中,几乎85%以上用DB2数据库服务器,而国内到97年约占5%。

热点内容
java培训到底怎么样 发布:2025-03-11 01:31:19 浏览:999
开机密码怎么设 发布:2025-03-11 01:31:18 浏览:511
公司邮箱收发件服务器怎么填 发布:2025-03-11 01:20:30 浏览:137
云主机怎么配置云桌面 发布:2025-03-11 01:17:39 浏览:208
c语言tinyxml 发布:2025-03-11 01:12:39 浏览:823
数据库inner 发布:2025-03-11 01:06:55 浏览:900
ice解压 发布:2025-03-11 00:54:50 浏览:379
网址批量访问 发布:2025-03-11 00:40:38 浏览:750
粉红视频脚本 发布:2025-03-11 00:39:56 浏览:446
服务器名称或ip从哪里看 发布:2025-03-11 00:35:44 浏览:493