当前位置:首页 » 操作系统 » 全文数据库检索

全文数据库检索

发布时间: 2022-07-13 11:28:17

A. 什么是全文数据库

全文数据库即收录有原始文献全文的数据库。

全文数据库以期刊论文、会议论文、政府出版物如政令文件等、研究报告、法律条文和案例、商业信息等为主。全文数据库免去了文献标引着录等加工环节,减少了数据组织中的人为因素,因此数据更新速度快,检索结果查准率更高;同时由于直接提供全文,省去了找到原文的麻烦,因此深受用户喜爱。

全文数据库具有强大的检索功能,表现在它能提供丰富的检索点,允许用户从信息载体的人名、地名、年代、关键词等多个角度进行单项检索或多项组配检索,甚至可对文本中任意字段进行检索。

(1)全文数据库检索扩展阅读:

全文数据库的作用

1、检索功能:全文数据库具有强大的检索功能,表现在它能提供丰富的检索点,允许用户从信息载体的人名、地名、年代、关键词等多个角度进行单项检索或多项组配检索,甚至可对文本中任意字段进行检索,甚至还可以进行字符检索等, 如布尔运算。

2、信息分析功能:全文数据库具有一定的信息分析功能,可对检索结果再次处理,以进行人名、地名、关键词等的聚类、统计排序。

3、信息统计功能:全文数据库还具有一定的信息计量功能,可对文本中的人名、地名、关键词等进行频率统计并排序,如根据检索的关键词生成搜索大数据等为决策等提供依据等。

B. 什么是全文信息检索

什么是全文数据库和全文信息检索

保存在数据库中的记录数据,从类型上可以分为两种。其一是结构化数据,象字符、日期、数值、货币等,这些数据都是具有有限长度或固定格式的数据;其二是非结构化数据,也叫全文数据,象简历、简介、论文等,这些数据都是以不定长、非固定格式保存的字符型数据。

现有的数据库系统,都是以结构化数据为检索的主要目标,因为实现相对简单。比如数值检索,可以建立一张排序好的索引表,以二分法实现查找,速度很快。但对于非结构化数据,即全文数据,要想实现检索,相对难度要大的很多了。

当然,你也许会说:“这个多简单呀,把全文数据读到内存,然后进行比较查找不就可以了?”。不错,的确是一个很朴素想法。不过最严重的问题是,如果数据库中有1万条,10万条,100万条记录的话,可以想象一下检索所消耗的时间了吧?!如果一个全文数据库系统,对一条检索命令的响应时间超过了半分钟,那么没有用户是能够容忍的了。

因此,全文检索的主要目的,就是实现对大容量的非结构化数据的快速查找。

C. 什么是全文数据库(full-text database)

一般用在文件检索方面,所谓全文是与一般的数据库比较而言的。一般的数据库中存储的只是某个文件的关键字,查找时也只能按照关键字去查找,而对于全文数据库,其中包含的是整个文章的内容。因此,在查询时,一般采用的是模糊查询。这样可以更多的涉及到文章的内容。

D. 常用的中文文献检索数据库有哪些

1、中国知网:

知网,是国家知识基础设施的概念,由世界银行于1998年提出。CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目。由清华大学、清华同方发起,始建于1999年6月。

凭借优质的内容资源、领先的技术和专业的服务,中国知网在业界享有极高的声誉,在2007年,中国知网旗下的《中国学术期刊网络出版总库》获首届“中国出版政府奖”,《中国博士学位论文全文数据库》、《中国年鉴网络出版总库》获提名奖。

2、万方:

万方数据库是由万方数据公司开发的,涵盖期刊、会议纪要、论文、学术成果、学术会议论文的大型网络数据库;也是和中国知网齐名的中国专业的学术数据库。

其开发公司——万方数据股份有限公司是国内第一家以信息服务为核心的股份制高新技术企业,是在互联网领域,集信息资源产品、信息增值服务和信息处理方案为一体的综合信息服务商。

3、中国年鉴网络出版总库

中国年鉴网络出版总库是目前国内最大的连续更新的动态年鉴资源全文数据库。内容覆盖基本国情、地理历史、政治军事外交、法律、经济、科学技术、教育、文化体育事业、医疗卫生、社会生活、人物、统计资料、文件标准与法律法规等各个领域。

4、中国引文数据库

该库收录了中国学术期刊(光盘版)电子杂志社出版的所有源数据库产品的参考文献,涉及期刊类型、学位论文类型、会议论文类型、图书类型、专利类型、标准类型、报纸类型等超千万次被引文献。

该库通过揭示各种类型文献之间的相互引证关系,不仅可以为科学研究提供新的交流模式,同时也可以作为一种有效的科学管理及评价工具。

5、维普数据库系统

维普资讯网建成于2000年,现已成为全球着名的中文信息服务网站,是Google Scholar最大的中文内容合作网站,中国最大的数字期刊数据库,目前拥有2000余家集团用户,网站注册用户数超过200余万。

网站内容服务包括9000余种/2000万篇中文期刊全文;30余个国家/11300余种/800余万条外文期刊文献;400多种重要中文报纸信息,学科覆盖理、工、农、医、文、史、哲、法各个领域,并提供网上每日更新。




E. oracle数据库实现全文检索

Oracle全文检索配置方法:

1.检查数据库是否具有全文检索功能(这是针对已经建成使用的数据库)

查看用户中是否存在ctxsys用户,查询角色里是否存在ctxapp角色。以上两个中的1个不满足(不存在),则说明没有装过全文检索功能。

使用contains函数的时候,若没有全文检索则会报错的。

2.若没有,则需要手动建立,先建立全文检索要使用的空间

sqlplus / as sysdba --进入控制台

createtablespaceIdx_ctxsysdatafile'/oradata/sg186fx/ctxsys01.;--创建全文检索使用的表空间

3.创建全文检索使用的用户和角色及相应的包,则需要执行oracle自带的一个脚本:cd $ORACLE_HOME/ctx/admin/catctx.sql

还是在sqlplus中执行:

@?/ctx/admin/catctx.sql ctxsys Idx_ctxsys temp nolock

在执行这个脚本的时候,输入了几个参数,第一个参数ctxsys为ctxsys用户的密码

第二个参数Idx_ctxsys为ctxsys用户要使用的表空间

第三个参数temp为ctxsys用户使用的临时表空间

第四个参数nolock为ctxsys用户处于解锁状态。

4.创建完成后,要登录ctxsys用户

connect ctxsys/ctxsys

执行以下脚本:@?/ctx/admin/defaults/drdefus.sql(这是个很重要的脚本,后面创建索引会使用该脚本创建的信息)

5.创建全文索引语法分析器

先要明确使用全文索引的用户,我要使用全文索引的是sgpm用户

因此

grantexecuteonctxsys.ctx_ddltosgpmwithgrantoption;

connect sgpm/sgpm

设置语法分析器:

execctx_ddl.drop_preference('chinalexer');
execctx_ddl.create_preference('chinalexer','chinese_lexer');

设置词法属性:

execctx_ddl.drop_preference('idx_c_store');
begin
ctx_ddl.create_preference('idx_c_store','BASIC_STORAGE');
ctx_ddl.set_attribut('idx_c_store','I_TABLE_CLAUSE','tablespacesIdx_ctxsy');
ctx_ddl.set_attribute('idx_c_store','I_INDEX_CLAUSE','tablespaceIdx_ctxsycompress2');
end;
/

6.创建索引

createindexsgpm.idx_c_cons_nameonsgpm.c_cons(cons_name)indextypeisctxsys.contextparameters('lexerchinalexerstorageidx_c_store');

7.同步索引

variablejobnonumber;
begin
dbms_job.submit(:jobno,'pkg_sp_tools.p_cont_sys_index();',sysdate,'trunc(sysdate)+19/24+1');--执行的是个性化方法。
end;
/

普通的就是用:

execctx_ddl.sync_index('idx_c_cons_name');

到此,全文检索创建成功,contains函数就可以正常使用了。

注意:创建的过程中会出现ORA-29879:cannot create multiple domain index on a column listusing same indextype ,这说明在其他用户下已经建立了该索引。

F. 中国期刊全文数据库检索的途径有那些举例说明如何应用。

有以下途径:初级检索、高级检索、聚类检索、二次检索。

以高级搜索为例进行演示。

工具:电脑。

1、在主页搜索栏的左侧可以看到一个可下拉的框,右侧有“高级检索”链接,这两个地方都是可以限定条件进行搜索的(图内红框标注)。

G. ebsco全文数据库有哪些检索方式

(1)基本检索
步骤一:输入检索词,可使用上述任意检索技术。
步骤二:选择数据库,以限定在某一数据库中进行检索。
步骤三(可选):限制结果,可对检索结果做进一步限定。包括:全文、是否有参考文献,是否专家评审刊、出版日期、出版物、页数、附带图像的文章等。还可用相关词、相关全文来扩大检索的范围。
(2)高级检索
提供所有字段、着者、文章标题、主题词、文摘、地名、人名、评论和产品名、公司名、NAICS码或叙词、DUNS码、ISSN号、ISBN号、期刊名称、索取号等范围进行检索。
步骤一:输入检索词,可使用上述任意检索技术。最多可在三个检索框中输入检索词进行检索。
步骤二:选择检索字段,可选择上述任一检索字段。
步骤三:选择各检索框的组配方式“and”,“or”,“not”
步骤四:限制结果,可对检索结果做进一步限定。包括:全文、是否有参考文献,是否专家评审刊、出版日期、出版物、页数、附带图像的文章等。还可用相关词、相关全文来扩大检索的范围。
(3)视觉检索
在查找字段中输入搜索词语,然后单击搜索。这时会显示一个视觉导航图,其中包含:
A.柱形,表示结果的类别。类别中可以包括表示子类别的圆柱。单击某柱形(类别)可查看其内容。
B.矩形,表示文章的链接。单击某矩形可将该文章加载到窗格中。
要在导航图中向后(或向上)移动,可单击柱形或矩形的外部。单击顶部,可查看整个导航图。
(4)辅助检索
在检索页面的最上方,还提供其它检索途径,点击工具栏的相关按钮,即可进行辅助检索。
A.Publications--出版物名称检索
使用出版物名称检索和浏览。检索结果显示:刊名、国际统一刊号、更新频率、价格、出版者、学科、主题、收录文摘或全文的起始时间等。
B.Subject Terms--规范化主题检索
利用系统提供的规范化主题词检索,可供选择的主题有:All(所有的主题)、People(人物)、Procts & Books (产品与图书)、Companies(公司企业)、Subjects(主题),这种方法检索效率高,相关性大。
C.Cited reference—引文检索:
可输入相关检索词在被引作者(Cited Author)、被引题名(Cited Title)、被引来源(Cited Source)、被引年限(Cited Year)及所有引用字段(All Citation Fields)进行引文检索。
D.索引—索引检索
首先选择索引项,可供选择的索引项有作者、作者提供的关键词、公司名、文献类型、DUNS码、日期、地名、主题标目、ISBN、ISSN、期刊名、语种、NAICS码或叙词、人名、评论或产品、主题词、出版年。再在“浏览:”后输入词语进行定位。
E.Images--图片检索:
可输入检索词,并可进行图像类型(所有类型、人物图像、自然科学图像、地理图像、历史图像、地图和旗帜)的限定。 也可以搜索相关关键字、自动 "And" 检索词语。

热点内容
shell脚本调用sql脚本 发布:2025-01-22 20:53:51 浏览:427
解压洗浴 发布:2025-01-22 20:51:01 浏览:474
tplink云服务器 发布:2025-01-22 20:32:35 浏览:146
videots文件夹 发布:2025-01-22 20:31:40 浏览:312
apm编程 发布:2025-01-22 20:08:08 浏览:762
中乙数据库 发布:2025-01-22 20:08:08 浏览:841
a8源码网 发布:2025-01-22 20:06:42 浏览:181
新闻头条源码 发布:2025-01-22 20:06:37 浏览:917
社保卡的交易密码怎么修改密码 发布:2025-01-22 20:05:09 浏览:693
如何把旧安卓机改造为游戏机 发布:2025-01-22 19:54:35 浏览:624