当前位置:首页 » 操作系统 » xml数据库技术

xml数据库技术

发布时间: 2023-06-17 23:49:57

Ⅰ XML和数据库的区别

数据库操作的话,毕竟是比较慢的,相对于xml来说,是有点复杂一些。如果是复杂多的数据的话,你就可以使用数据库。但如果是很少的数据交互就使用xml

Ⅱ xml数据库的特点

与传统数据库相比,XML数据库具有以下优势:
1、XML数据库能够对半结构化数据进行有效的存取和管理。如网页内容就是一种半结构化数据,而传统的关系数据库对于类似网页内容这类半结构化数据无法进行有效的管理。
2、提供对标签和路径的操作。传统数据库语言允许对数据元素的值进行操作,不能对元素名称操作,半结构化数据库提供了对标签名称的操作,还包括了对路径的操作。
3、当数据本身具有层次特征时,由于XML数据格式能够清晰表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作。XML数据库适合管理复杂数据结构的数据集,如果己经以XML格式存储信息,则XML数据库利于文档存储和检索;可以用方便实用的方式检索文档,并能够提供高质量的全文搜索引擎。另外XML数据库能够存储和查询异种的文档结构,提供对异种信息存取的支持。

Ⅲ 什么是xml数据库

开始讨论XML和数据库之前,我们先回答许多人都遇到过的问题:“XML是数据库吗?”

如果仅按数据库这个术语的本质来看,XML文件就是数据库,它是数据的集合。在许多方面看起来它和其他文件没什么区别 -- 无论如何,每个文件都含有某种类型的数据。作为一种“数据库”格式,XML有一些优势:例如,它是自描述的(所用的标记描述了数据的结构和类型,尽管缺乏语义),可交换的(portable)(Unicode),能够以树型或图形结构描述数据。同样它也有缺点,例如,它显得有些繁琐,由于要对它进行解析和文本转换,所以数据访问速度较慢。

一个更有用的问题就是在较为宽松的意义上,XML及其周边技术是否可以算作“数据库” -- 数据库管理系统(DBMS)。答案是“在某种程度上是(sort of)”。从正面来说,XML提供了许多数据库所具备的东西:存储(XML文档), 模式(DTD, XML schema,RElAX NG 等等), 查询语言(XQuery, XPath, XQL, XML-QL, QUILT等等),编程接口(SAX, DOM,JDOM)等等。从反面来说,它缺少一些作为实用的数据库所应具备的特性:高效的存储,索引,安全,事务和数据一致性,多用户访问,触发器,在查询多个文件等等。

因此,尽管在数据量小、用户少和性能要求不太高的环境下,可以将XML文档用作数据库,但是却不适用于用户量大、数据集成度高以及性能要求高的作业环境。

XML适合于用作所谓“数据库”的一个好例子就是 .ini文件 -- 它包含应用程序的配置信息。与其写一个处理以逗号分隔(comma-delimited)的文件的解析器,开发一种小型的XML语言并写一个解释它的 SAX程序要容易的多。此外,XML允许使用嵌套的实体,而逗号分隔的文件(comma-delimited files)很难做到这点。然而,说它就是数据库还很勉强,因为它是线性读写的,而且仅用在程序开始和结束时。

比较适合于XML数据库的一些复杂的数据集就是个人通讯录(名字,电话号码,地址等),或用于描述浏览器书签以及用Napster偷来的MP3。然而,由于dBase和Access之类的数据库物美价廉,即使在这种情况下似乎也没有多少理由把XML文件作为数据库使用。XML的唯一真正好处就是数据的可交换性(portable),由于有越来越多的工具可以用来对数据库进行XML序列化(serializing),这一点好处似乎也要打些折扣。

Ⅳ XML与关系数据库的关系

数据库技术及其应用系统经历了从层次数据库、网状数据库到关系数据库以及面向对象数据库的发展,在传统的商业和事务处理领域内逐步成熟,取代了原有的基于文件系统的数据处理方式,成为计算机信息系统中的重要基础和支柱。但随着Internet的飞速发展,Web的出现改变了人们习惯的处理方式,也给数据库技术提出了必须面对的重要问题:即如何有效地存储和管理Web上的数据(文档),使其既能被高效地操作和维护,又能在Internet平台上方便地表示和交换。

XML技术自出现以来发展非常迅速,在许多领域内得到广泛的支持而有着广阔的应用前景。例如电子数据交换、电子商务等更是将XML作为一种基础性、支柱性的技术来看待。

1、数据库简史

数据库系统是随着计算机技术的不断发展,在特定的历史时期、特定的需求环境下出现的。在1946年的第一台计算机到20世纪60年代这漫长的20年里,计算机操作系统主要局限于文件的操作,对数据的管理也主要是通过文件系统来实现。进行计算所需要的各种数据存放在各自的文件里,使用这些数据时将文件打开,读取文件中的数据到内存中,当计算完毕后,将计算结果仍旧写入到文件中去,它的不足主要集中在无法对数据进行有效的统一管理。针对文件系统的重要缺点,人们逐步发展了以统一管理数据和共享数据为主要特征的系统,即数据库系统。1964年,美国通用电气公司开发成功了世界上的第一个数据库系统IDS(IntegratedDataStore)。IDS奠定了网状数据库的基础,并得到了广泛的发行和应用,成为数据库系统发展史上的一座丰碑。1969年,美国国际商用机器公司(IBM)也推出世界上第一个层次数据库系统IMS(InformationManagement System),同样在数据库系统发展史上占有重要的地位。

70年代初,E.F.Codd在总结前面的层次、网状数据库优缺点的基础上,提出了关系数据模型的概念及关系代数和关系演算。在70年代,关系数据库系统无论从理论上还是实践上都取得了丰硕的成果。在理论上确立了完整的关系模型理论、数据依赖理论和关系数据库的设计理论;在实践上,世界上出现了很多着名的关系数据库系统,比较着名的如SystemR、INGRES、Oracle等。

与文件系统相比,数据库系统有几个方面的特点:向用户提供高级的接口;向用户提供非过程化的数据库语言(即SQL语言);查询的处理和优化;并发控制;数据的完整性约束。

进入80年代之后,计算机硬件技术的飞速提高促使计算机应用不断深入,产生了许多新的应用领域,例如计算机辅助设计、计算机辅助制造、计算机辅助教学、办公自动化、智能信息处理、决策支持等。这些新的领域对数据库系统提出了新的要求。但由于应用的多元化,不能设计出一个统一的数据模型来表示这些新型的数据及其相互关系,因而出现了百家争鸣的局面,产生了演绎数据库、面向对象数据库、分布式数据库、工程数据库、时态数据库、模糊数据库等新型数据库的研究和应用。

2、XML简介

XML推荐标准1.0版发布于1998年2月,之后迅速在全球掀起了XML应用的浪潮。XML是一种描述型的标记语言,与HTML同为SGML(标准通用标记语言,ISO-8879国际标准)的一种应用。由于XML在可扩展性、可移植性和结构性等方面的突出优点,它的应用范围突破了HTML所达到的范围。

一篇XML文档由标记和内容组成。XML中有六种标记:元素(elements)、属性(attributes)、实体引用(entityreferences)、注释(comments)、处理指令(processinginstructions)和CDATA段(CDATAsections)。XML与HTML最显着的不同是XML文档中引入了“文档类型声明”(Document Type Declarations)。DTD使文档可以与分析器交流关于它的内容的元信息。DTD的出现,赋予了XML文档可扩展性、结构性和可验证性,使XML具备了类似于数据库的一些性质,可以利用XML来组织和管理信息;又可以与HTML一样在浏览器中方便地表示,在Internet上高效地传递和交换。考虑到与HTML的兼容,DTD并不是XML文档必需的成份。具有DTD的XML文档称作“Valid”,否则就是“Well-formed”。

目前,处理XML文档的方式主要有SAX与DOM两种。SAX(SimpleAPIforXML)是一种基于流的、以事件处理方式工作的接口。SAX 2.0在2000年5月发布,增强了许多功能,包括对名字空间的支持。DOM(Document Object Model)则是在对XML文档进行分析后,在内存中建立起一个完整的树结构,然后在此基础上进行各种操作。简单地比较来看,SAX对系统资源要求低、速度快,但对文档的操作是只读的;DOM的处理能力强大,但要求大量的系统资源,尤其是对于大的文档。而后还出现了Xpath和Xpointer用以完成XML的搜索和转换;XSL、XSLT和SOAP用以完成XML的远程对象访问,XML Query Languages的出现使XML查询语言可用于任何XML文档。

3、XML与数据库

XML文件是数据的集合,它是自描述的、可交换的,能够以树型或图形结构描述数据。XML提供了许多数据库所具备的工具:存储(XML文档)、模式(DTD,XMLschema,RE1AXNG等)、查询语言(XQuery,XPath,XQL,XML-QL,QUILT等)、编程接口(SAX,DOM,JDOM)等。但XML并不能完全替代数据库技术。XML缺少作为实用的数据库所应具备的特性:高效的存储、索引和数据修改机制;严格的数据安全控制;完整的事务和数据一致性控制;多用户访问机制;触发器、完善的并发控制等。因此,尽管在数据量小、用户少和性能要求不太高的环境下,可以将XML文档用作数据库,但却不适用于用户量大、数据集成度高以及性能要求高的作业环境。

随着Web技术的不断发展,信息共享和数据交换的范围不断扩大,传统的关系数据库也面临着挑战。数据库技术的应用是建立在数据库管理系统基础上的,各数据库管理系统之间的异构性及其所依赖操作系统的异构性,严重限制了信息共享和数据交换范围;数据库技术的语义描述能力差,大多通过技术文档表示,很难实现数据语义的持久性和传递性,而数据交换和信息共享都是基于语义进行的,在异构应用数据交换时,不利于计算机基于语义自动进行正确数据的检索与应用;数据库属于高端应用,需要昂贵的价格和运行环境。而随着网络和Internet的发展,数据交换的能力已成为新的应用系统的一个重要的要求。XML的好处是数据的可交换性(portable),同时在数据应用方面还具有如下优点:(1)XML文件为纯文本文件,不受操作系统、软件平台的限制;(2)XML具有基于Schema自描述语义的功能,容易描述数据的语义,这种描述能为计算机理解和自动处理;(3)XML不仅可以描述结构化数据,还可有效描述半结构化,甚至非结构化数据。

4、XML文件的存储

XML文件的存储方式有三大类:(1)将文件存储于文件系统(StoringDocumentsinthe File System);(2)将文件存储于BLOB(Storing Documents in BLOBs),利用数据库的事务管理、安全、多用户访问等优点。此外许多关系数据库提供的检索工具可以进行全文检索、近似检索、同义词检索和模糊检索。其中某些工具将会支持XML,这样就可消除将XML文件作为纯文本检索所带来的问题。(3)将文件存储于原生XML数据库(Native XML Databases,NXD)。NXD是专用于存储XML文件的数据库,支持事务管理、安全、多用户访问、编程API和查询语言等。与其它数据库的唯一区别在于其内部模型是基于XML的。其中,最重要的存储方式当属原生XML数据库。

4.1原生XML数据库

原生XML数据库(NativeXMLDatabases)为XML文档定义了一个(逻辑)模型,并根据该模型存取文件。这个模型至少应包括元素、属性、PCDATA和文件顺序。其例子有XPath数据模型、XMLIn-foset以及DOM所用的模型和SAX 1.0的事件。它以XML文件作为其基本存储单位,对底层的物理存储模型没有特殊要求。例如,它可以建在关系型、层次型或面向对象的数据库之上,或者使用专用的存储格式,比如索引或压缩文件。

NXD最适于存储以文档为中心的文件。这是由于NXD保留了文件、顺序、处理指令、注释、CDA-TA块以及实体引用等,而支持XML的数据库XED(XML-enableddatabase)无法做到。XED是在原有数据库基础上扩展了XML支持模块,完成XML数据和数据库之间的格式转换和传输。从存储粒度上,可以把整个XML文档作为RDBMS表中一行,或把XML文档进行解析后,存储到相应的表格中。为了支持W3C的一些XML操作标准,Xpath、XED提供一些新的原语(如Oracle9iR2增加了一些数据包来操作XML数据等),并优化了XML处理模块.

Ⅳ 推荐一些关于xml数据库技术相关的书,最好对相关技术,比如查询及其优化算法有比较详细描述的~多谢


计算机技术对电子商务的作用

电子商务是指通过互联网完成的商务交易。作为依托互联网发展起来的商业运作模式,与传统商业比较给人们曾带来过很多欣喜,但是随着电子商务交易的不断发展,暴露出了一些技术问题,如EDI(Electronic Data Interchange)中的问题等,使电子商务一度陷入举步为艰的地步。
一、EDI在电子商务中的应用
联合国EDIFACT培训指南认为:“EDI指的是在最少的人工干预下,在贸易伙伴的计算机应用系统之间的标准格式数据的交换”。 EDI主要由UN/EDIFACT的基础标准体系和开放式EDI基础标准两部分组成。它是EDI的核心标准体系。EDI主要是为完成企业间的数据交换而产生和应用的。虽然EDI的应用使企业之间大大减少了在交易中的时间、效率上的开销,但是传统的EDI却仍然存在不少的缺陷:
1.实现EDI的成本过于昂贵
EDI通信方式有两种:一种是在贸易伙伴之间建立专用网;另一种是增值网络(VAN)方式,建立专用网的费用是不言而喻的,而VAN是一套私有网络,它的租用、维护费用也是很昂贵的。对于中小型企业来说,这两种方式的费用都是很难承受的。有数据显示:全球使用EDI进行电子商务的企业98%来自世界前1000强。这样也就限制了中小型企业加入到电子商务行列中的步伐,并有碍于电子商务全球化的进程。
2.EDI标准结构的灵活性较差
EDI使用的是一套预先定义好的报文标准,在与其他企业集成时不能随业务环境的变化而进行自动的调整。这些不利于企业业务的发展。
3.EDI不能通过构建Web Service来跨越多个应用程序和供应商进行通信
在Web Service持续发展的今天,越来越多企业认识到了Web Service的巨大潜力,开始把它运用到他们的组织中,可是原有的EDI技术模式使企业无法利用EDI去实现这一目标。
4.EDI难以实现电子商务中的数据挖掘
EDI主要通过单证传递来完成企业之间信息交流,现在的电子商务已经不仅仅是停留在数据的传递上,而且要通过Web收集大量的、各种商业数据来进行数据挖掘,从中得到有利于企业战略决策的信息。
二、XML在电子商务中的应用
1.XML的简介
XML(eXtensible Markup Language)是W3C于1998年2月发布的一种标准,它是SGML的简化子集,将SGML的功能和HTML的易用性结合到Web的应用中,以一种开放的自我描述方式定义数据结构,在描述数据内容的同时能突出对结构的描述,从而体现出数据之间的关系。
2.XML的特点
(1)XML成为不同格式数据向标准化格式数据转换的“桥梁”。由于处于Web中的电子商务,其中涉及的很多数据源都是异构的,XML在各种数据源之间建立了一个数据格式的中间标准,利用XML中的XSLT技术实现了不同格式的数据与XML文档之间的双向转换与传输,并方便地进行Web应用。
(2)文档管理功能。XML中的XLL(eXtensible Linkage Language)技术是表示XML文档之间的链接方法,XLL与HTML中的超链接相似,但功能更强,例如可以链接文档的特定部分。此方法使文档更易于检索等,也可以使很多公司从海洋一样的文书工作中解脱出来。
(3)XML可以成为信息存储和管理的方式。XML可以很轻松地完成与很多类型的企业数据库的交互操作,例如从SQL查询中检索XML数据以及修改XML数据记录。这就使XML如同传统的数据库技术一样,易于操作。
(4)XML可以完成企业之间业务数据的传输。各种业务数据是以XML格式在企业之间传输。与EDI相比,不仅可以完成从一种票据格式到另一种票据格式的转换,还有多种企业需要的基于票据各种操作,而且过程简单、快捷,成本低廉。
(5)可以完成基于Web的数据挖掘。主要分为数据挖掘和挖掘表示两个部分。数据挖掘就是利用合适的挖掘算法和已有的知识库知识对统一的XML 文档进行数据提取,可以采用诸如特征抽取、关联分析、属性分类、聚类分析等方法实现。挖掘表示是指对挖掘出的Web 数据经过模式评估和解释用适当的形式表现出来,例如图形,以便于用户理解和使用。

3.XML的缺点
虽然XML很好地解决了EDI技术中的一些缺陷,并且XML已经成为Internet上数据交换事实上的标准。主要基于它的优点:扩展性、自描述性、系统无关性、健壮性、形式与内容分离等。但通过实践证明,它仍然不能构建Web服务来跨越多个应用程序和供应商进行通信。这也就促成了ebXML的诞生。
EML-EDI在电子商务中的应用:如果基于XML技术的诸多优点,而直接用它来完全替代原来的EDI,显然会给企业带来多方面的不利,比如:资金上、技术上等的影响。因此,产生了过度技术模式——XML-EDI。在EML-EDI的模式中,为了保护原有投资,大企业之间依旧采用原有的EDI系统,采用EDI/VAN交换数据。
ebXML在电子商务中的应用:ebXML是由UN/CEFACT和OASIS 两家组织发起和制定的一个规范集, 这些规范共同实现了模块化电子商务框架。ebXML的目标是实现跨行业的B2B、B2C商业贸易,甚至全球性的电子商务市场,使得不同规模和不同地区的企业可以通过交换基于XML格式的消息来合作和进行商业活动。
ebXML体系架构由许多部分组成,其主要有:
(1)消息服务:消息组成了商业伙伴间的交易对话,是商务过程的基础。ebXML可以创建各种类型的消息,对各种消息提供支持,以确保安全可靠的交换有效负载。
(2)注册库或知识库:是ebXML 体系结构的核心,用来注册和存储商业流程和商业信息模型等,它使得ebXML工作所需要的各种数据能够统一存放,以便复用和保持一致性。
(3)贸易伙伴信息:描述贸易伙伴参与贸易活动所必须的信息,也是双方进行电子商务的技术细节,包含贸易伙伴个人信息CPP 和CPP 基础上双方协商出来的CPA。
(4)商务流程规范:ebXML是建立在商务流程建模的基础上,ebXML规范体系集中包含着定义描述商务流程和信息模型的标准机制BPSS(Business Process Specification Schema),是企业双方进行电子商务的商业细节。当企业要进行电子商务并决定采用ebXML 框架时,首先通过在注册库中查找,找到符合自己条件的商业模型,并下载ebXML的技术规范;然后按照该规范在本地系统上构建ebXML的应用实现,并创建一个合作伙伴概要CPP来描述企业系统的实现细节和提供的功能信息服务,可以加入新的商务流程,也可以只是引用已有的流程,随后将其注册到注册中心。这样其他采用ebXML标准的企业就可以通过注册库查找该企业的CPP,双方系统在CPP的基础上自动协商,最终达成CPA等交互协议约定,以后双方便在此基础上进行交易。
电子商务经历了以上三种主要的、一种过度的计算机技术的发展,逐步走向完善。另外,从中我们可以看到,ebXML的开放性以及接纳现有标准和方法的做法,使得它很易于被人们接受 ,而且ebXML 允许商家以不同的方式进行商业活动,因此具有更广泛的市场和应用前景。
参考文献:
[1]宋沛军:电子商务概论[M].西安:西安电子科技大学出版社,2005
[2]陈尧妃倪应华:基于XML个性化数据挖掘框架设计[J].现代电子技术,2007 No.2
[3]沈世铭尹绍宏:基于XML在异构数据之间转换的研究[J].仪器仪表用户, 2007 No.1
[4]ebXML overview,
[5]郝萍饶若楠:一种基于MDA 的ebXML[J].计算机应用与软件,2005 No.3

Ⅵ xml数据库的简介

目前XML数据库有三种类型:
(1)XMLEnabledDatabase(XEDB),即能处理XML的数据库。其特点是在原有的数据库系统上扩充对XML数据的处理功能,使之能适应XML数据存储和查询的需要。一般的做法是在数据库系统之上增加XML映射层,这可以由数据库供应商提供,也可以由第三方厂商提供。映射层管理XML数据的存储和检索,但原始的XML元数据和结构可能会丢失,而且数据检索的结果不能保证是原始的XML形式。XEDB的基本存储单位与具体的实现紧密相关。
(2)NativeXMLDatabase(NXD),即纯XML数据库。其特点是以自然的方式处理XML数据,以XML文档作为基本的逻辑存储单位,针对XML的数据存储和查询特点专门设计适用的数据模型和处理方法。
(3)HybridXMLDatabase(HXD),即混合XML数据库。根据应用的需求,可以视其为XEDB或NXD的数据库,典型的例子是Ozone。
XML数据库是一个能够在应用中管理XML数据和文档的集合的数据库系统。XML数据库是XML文档及其部件的集合,并通过一个具有能力管理和控制这个文档集合本身及其所表示信息的系统来维护。XML数据库不仅是结构化数据和半结构化数据的存储库,像管理其它数据一样,持久的XML数据管理包括数据的独立性、集成性、访问权限、视图、完备性、冗余性、一致性以及数据恢复等。这些文档是持久的并且是可以操作的。
当前着重于页面显示格式的HTML标记语言和基于它的关键词检索等技术已经不能满足用户日益增长的信息需求。近年来的研究致力于将数据库技术应用于网上数据的管理和查询,使查询可以在更细的粒度上进行,并集成多个数据源的数据。但困难在于网上数据缺乏统一的、固定的模式,数据往往是不规则且经常变动的。因此,XML数据作为一种自描述的半结构化数据为Web的数据管理提供了新的数据模型,如果将XML标记数据放入一定的结构中,对数据的检索、分析、更新和输出就能够在更加容易管理的、系统的和较为熟悉的环境下进行,因而我们将数据库技术应用于XML数据处理领域,通过XML数据模型与数据库模型的映射来存储、提取、综合和分析XML文档的内容。这为数据库研究开拓了一个新的方向,将数据库技术的研究扩展到对Web数据的管理。

热点内容
urlftp 发布:2025-03-22 05:57:45 浏览:570
半导体静态存储器 发布:2025-03-22 05:53:34 浏览:793
编程知识卡片 发布:2025-03-22 05:40:40 浏览:371
搭建的网站服务器连接失败 发布:2025-03-22 05:39:08 浏览:592
浪潮的服务器地址 发布:2025-03-22 05:37:30 浏览:410
凯撒加密在线 发布:2025-03-22 05:36:45 浏览:656
空调压缩机铭牌含义 发布:2025-03-22 05:27:03 浏览:62
编程强省 发布:2025-03-22 05:26:21 浏览:142
跨云服务器平台 发布:2025-03-22 05:25:30 浏览:654
安卓如何在宝马车上放歌 发布:2025-03-22 05:06:15 浏览:284