当前位置:首页 » 操作系统 » 数据库全文检索

数据库全文检索

发布时间: 2023-05-19 19:44:55

① 全文检索怎么实现

要实现全文检索需要2个必要的条件:一是需要将最终信息本身输入到计算机里,这个问题看似简单,实际上它包含了极大的工作量;二是需要有相应的软件支持,全文信息不仅包括书刊的文字信息,而且包括图片、声音、视频信息等各种信息资料,即使只将书刊及各种资料的文字信息输入计则老算机,其信息量就非常大了。

全文检索目前主要通过以下方式来实现:
①采用自由指定的检索项(如关键词、字符串等)直接基键与全文文本的一次数据高速对照,进行检索;
②对文本内容中的每个检索项进行位置扫描,然后排序,建立以每个检索项的离散码为表目的倒排文档;
③采用超文本模孙锋升型建立全文数据库,实现超文本检索。

② 中国期刊全文数据库检索的途径有那些举例说明如何应用。

有以下途径:

1、初级检索

初级检索能进行快速方便的查询,适用于不熟悉多条件组合查询或sql语句查询的用户,它为用户提供了详细的导航,最大范围的选择空间。

2、高级检索

利用高级检索系统能进行快速有效的组合查询,优点是查询结果冗余少,命中率高。

3、聚类检索

检索与本篇文章具有相同分类号的文章。

4、二次检滑烂索

5、分类检索分类检索利用导航体系逐步细化,最终检索出最小知识单元中包含的论文,这种检索方式主要使用导航区。

举其中的例子,检索有关“社区管理”2005年至今的期刊全部文献。

初级检索的具体步骤如下:

1、进入中国期刊全文检索,选择检索项“主题”,输入检索词“社区管理” ;选择从“2005”到“2011”,选择“更新”中的“全部数据 ’。

③ 在数据库中使用全文索引的好外与坏处

好处上面已经说了。最大的优点其实就是检索速度快,对服务器的负荷降低
缺点,如果说有的话,就是需要进行填充
上一次填充后,你增加的内容,直到你再次增量填充,否则是检索不到的。
你可以根据自己更新内容的频率设置调度来自动执行。

④ 常用的中文文献检索数据库有哪些

1、中国知网:

知网,是国家知识基础设施的概念,由世界银行于1998年提出。CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目。由清华大学、清华同方发起,始建于1999年6月。

凭借优质的内容资源、领先的技术和专业的服务,中国知网在业界享有极高的声誉,在2007年,中国知网旗下的《中国学术期刊网络出版总库》获首届“中国出版政府奖”,《中国博士学位论文全文数据库》、《中国年鉴网络出版总库》获提名奖。

2、万方:

万方数据库是由万方数据公司开发的,涵盖期刊、会议纪要、论文、学术成果、学术会议论文的大型网络数据库;也是和中国知网齐名的中国专业的学术数据库。

其开发公司——万方数据股份有限公司是国内第一家以信息服务为核心的股份制高新技术企业,是在互联网领域,集信息资源产品、信息增值服务和信息处理方案为一体的综合信息服务商。

3、中国年鉴网络出版总库

中国年鉴网络出版总库是目前国内最大的连续更新的动态年鉴资源全文数据库。内容覆盖基本国情、地理历史、政治军事外交、法律、经济、科学技术、教育、文化体育事业、医疗卫生、社会生活、人物、统计资料、文件标准与法律法规等各个领域。

4、中国引文数据库

该库收录了中国学术期刊(光盘版)电子杂志社出版的所有源数据库产品的参考文献,涉及期刊类型、学位论文类型、会议论文类型、图书类型、专利类型、标准类型、报纸类型等超千万次被引文献。

该库通过揭示各种类型文献之间的相互引证关系,不仅可以为科学研究提供新的交流模式,同时也可以作为一种有效的科学管理及评价工具。

5、维普数据库系统

维普资讯网建成于2000年,现已成为全球着名的中文信息服务网站,是Google Scholar最大的中文内容合作网站,中国最大的数字期刊数据库,目前拥有2000余家集团用户,网站注册用户数超过200余万。

网站内容服务包括9000余种/2000万篇中文期刊全文;30余个国家/11300余种/800余万条外文期刊文献;400多种重要中文报纸信息,学科覆盖理、工、农、医、文、史、哲、法各个领域,并提供网上每日更新。




⑤ 如何用C#实现数据库全文检索

目前行业网站的全文检索的方式主要有两种
方式一:通过数据库自带的全文索引
方式二:通过程序来自建全文索引系统
以sql server 2005为例
2005本身就自带全文索引功能,你可以先对数据库表
建立索引,具体如何建索引网上搜索一下,建立完索引之后,你就可以用sql来实现检索功能,例如:select * from ytbxw where
contaiins(字段,' 中国');多个查询值之间可以用and 或
or来实现,在单表以及单表视图上建全文索引对2005来说根本不是问题,但在多表视图建全文索引2005目前还无法实现这个功能,拿
www.ytbxw.com为例,其每个栏目的信息都是分开存放的,所以在检索上就无法用该方法来解决这个问题.
下面重点说一下如何用程序来实现检索功能
如果你想自己开发一个全文检索系统,我想这是相当复杂事情,要想实现也不是那么容易的事情,所以在这里我推荐一套开源程序,那就是dotlucene,我想大家可能都听过这个东东吧,那我就讲讲如何来实现多表情况下的全文检索.
1、新建winform项目,把lucene.net.dll添加到该项目中来
2、创建一个类,类名可以自己取
public class indexer
{
private indexwriter writer;
//在指定路径下创建索引文件
public indexer(string directory)
{
writer = new indexwriter(directory, new standardanalyzer(), true);
writer.setusecompoundfile(true);
}
//将信息添加到索引文件中
/*
field.text:为索引+读取
field.unindexed:不需要做索引
*/
public void addhtmldocument(string path,string title,string content)
{
document doc = new document();
doc.add(field.text("text", content));
doc.add(field.unindexed("path", path));
doc.add(field.text("title", title));
writer.adddocument(doc);
}
//解析html,过滤html代码
private string parsehtml(string html)
{
string temp = regex.replace(html, "<[^>]*>", "");
return temp.replace(" ", " ");
}
//从页面中获取文章标题
private string gettitle(string html)
{
match m = regex.match(html, "<title>(.*)</title>");
if (m.groups.count == 2)
return m.groups[1].value;
return "(unknown)";
}
//添加新闻到索引
public void addnews()
{
//从数据库获取记录(这部分略过)
for (int i = 1; i <= pagesize; i++)
{
rootid = int.parse(dr["classid"].tostring().substring(0, 2));
// 写入索引

addhtmldocument(http://www.ytbxw.com + dr["id"].tostring() + ".html",
dr["title"].tostring(), parsehtml(dr["content"].tostring()));
}/info/
}
//关闭索引
public void close()
{
writer.optimize();
writer.close();
}
}

⑥ 什么是全文信息检索

什么是全文数据库和全文信息检索

保存在数据库中的记录数据,从类型上可以分为两种。其一是结构化数据,象字符、日期、数值、货币等,这些数据都是具有有限长度或固定格式的数据;其二是非结构化数据,也叫全文数据,象简历、简介、论文等,这些数据都是以不定长、非固定格式保存的字符型数据。

现有的数据库系统,都是以结构化数据为检索的主要目标,因为实现相对简单。比如数值检索,可以建立一张排序好的索引表,以二分法实现查找,速度很快。但对于非结构化数据,即全文数据,要想实现检索,相对难度要大的很多了。

当然,你也许会说:“这个多简单呀,把全文数据读到内存,然后进行比较查找不就可以了?”。不错,的确是一个很朴素想法。不过最严重的问题是,如果数据库中有1万条,10万条,100万条记录的话,可以想象一下检索所消耗的时间了吧?!如果一个全文数据库系统,对一条检索命令的响应时间超过了半分钟,那么没有用户是能够容忍的了。

因此,全文检索的主要目的,就是实现对大容量的非结构化数据的快速查找。

⑦ oracle数据库实现全文检索

Oracle全文检索配置方法:

1.检查数据库是否具有全文检索功能(这是针对已经建成使用的数据库)

查看用户中是否存在ctxsys用户,查询角色里是否存在ctxapp角色。以上两个中的1个不满足(不存在),则说明没有装过全文检索功能。

使用contains函数的时候,若没有全文检索则会报错的。

2.若没有,则需要手动建立,先建立全文检索要使用的空间

sqlplus / as sysdba --进入控制台

createtablespaceIdx_ctxsysdatafile'/oradata/sg186fx/ctxsys01.;--创建全文检索使用的表空间

3.创建全文检索使用的用户和角色及相应的包,则需要执行oracle自带的一个脚本:cd $ORACLE_HOME/ctx/admin/catctx.sql

还是在sqlplus中执行:

@?/ctx/admin/catctx.sql ctxsys Idx_ctxsys temp nolock

在执行这个脚本的时候,输入了几个参数,第一个参数ctxsys为ctxsys用户的密码

第二个参数Idx_ctxsys为ctxsys用户要使用的表空间

第三个参数temp为ctxsys用户使用的临时表空间

第四个参数nolock为ctxsys用户处于解锁状态。

4.创建完成后,要登录ctxsys用户

connect ctxsys/ctxsys

执行以下脚本:@?/ctx/admin/defaults/drdefus.sql(这是个很重要的脚本,后面创建索引会使用该脚本创建的信息)

5.创建全文索引语法分析器

先要明确使用全文索引的用户,我要使用全文索引的是sgpm用户

因此

grantexecuteonctxsys.ctx_ddltosgpmwithgrantoption;

connect sgpm/sgpm

设置语法分析器:

execctx_ddl.drop_preference('chinalexer');
execctx_ddl.create_preference('chinalexer','chinese_lexer');

设置词法属性:

execctx_ddl.drop_preference('idx_c_store');
begin
ctx_ddl.create_preference('idx_c_store','BASIC_STORAGE');
ctx_ddl.set_attribut('idx_c_store','I_TABLE_CLAUSE','tablespacesIdx_ctxsy');
ctx_ddl.set_attribute('idx_c_store','I_INDEX_CLAUSE','tablespaceIdx_ctxsycompress2');
end;
/

6.创建索引

createindexsgpm.idx_c_cons_nameonsgpm.c_cons(cons_name)indextypeisctxsys.contextparameters('lexerchinalexerstorageidx_c_store');

7.同步索引

variablejobnonumber;
begin
dbms_job.submit(:jobno,'pkg_sp_tools.p_cont_sys_index();',sysdate,'trunc(sysdate)+19/24+1');--执行的是个性化方法。
end;
/

普通的就是用:

execctx_ddl.sync_index('idx_c_cons_name');

到此,全文检索创建成功,contains函数就可以正常使用了。

注意:创建的过程中会出现ORA-29879:cannot create multiple domain index on a column listusing same indextype ,这说明在其他用户下已经建立了该索引。

⑧ ebsco全文数据库有哪些检索方式

(1)基本检索
步骤一:输入检索词,可使用上述任意检索技术。
步骤二:选择数据库,以限定在某一数据库中进行检索。
步骤三(可选):限制结果,可对检索结果做进一步限定。包括:全文、是否有参考文献,是否专家评审刊、出版日期、出版物、页数、附带图像的文章等。还可用相关词、相关全文来扩大检索的范围。
(2)高级检索
提供所有字段、着者、文章标题、主题词、文摘、地名、人名、评论和产品名、公司名、NAICS码或叙词、DUNS码、ISSN号、ISBN号、期刊名称、索取号等范围进行检索。
步骤一:输入检索词,可使用上述任意检索技术。最多可在三个检索框中输入检索词进行检索。
步骤二:选择检索字段,可选择上述任一检索字段。
步骤三:选择各检索框的组配方式“and”,“or”,“not”
步骤四:限制结果,可对检索结果做进一步限定。包括:全文、是否有参考文献,是否专家评审刊、出版日期、出版物、页数、附带图像的文章等。还可用相关词、相关全文来扩大检索的范围。
(3)视觉检索
在查找字段中输入搜索词语,然后单击搜索。这时会显示一个视觉导航图,其中包含:
A.柱形,表示结果的类别。类别中可以包括表示子类别的圆柱。单击某柱形(类别)可查看其内容。
B.矩形,表示文章的链接。单击某矩形可将该文章加载到窗格中。
要在导航图中向后(或向上)移动,可单击柱形或矩形的外部。单击顶部,可查看整个导航图。
(4)辅助检索
在检索页面的最上方,还提供其它检索途径,点击工具栏的相关按钮,即可进行辅助检索。
A.Publications--出版物名称检索
使用出版物名称检索和浏览。检索结果显示:刊名、国际统一刊号、更新频率、价格、出版者、学科、主题、收录文摘或全文的起始时间等。
B.Subject Terms--规范化主题检索
利用系统提供的规范化主题词检索,可供选择的主题有:All(所有的主题)、People(人物)、Procts & Books (产品与图书)、Companies(公司企业)、Subjects(主题),这种方法检索效率高,相关性大。
C.Cited reference—引文检索:
可输入相关检索词在被引作者(Cited Author)、被引题名(Cited Title)、被引来源(Cited Source)、被引年限(Cited Year)及所有引用字段(All Citation Fields)进行引文检索。
D.索引—索引检索
首先选择索引项,可供选择的索引项有作者、作者提供的关键词、公司名、文献类型、DUNS码、日期、地名、主题标目、ISBN、ISSN、期刊名、语种、NAICS码或叙词、人名、评论或产品、主题词、出版年。再在“浏览:”后输入词语进行定位。
E.Images--图片检索:
可输入检索词,并可进行图像类型(所有类型、人物图像、自然科学图像、地理图像、历史图像、地图和旗帜)的限定。 也可以搜索相关关键字、自动 "And" 检索词语。

⑨ 维普数据库的检索方式有哪几种

维普数据库的检索方式有:“快速检索”、“传统检索”、“高级检索”、“分类检索”和“期刊导航”五种检索方法。

维普数据库检索功能介绍:

《中文科技期刊数据库》采用国内一流检索内核“尚唯全文检索系统”实现数据库的检索管理。“尚唯全文检索系统”是经国内专家团队鉴定一致认为达到“国内领先、国际先进”水平的检索系统, 各种指标及其综合性能均大大领先于其核备它同类产品。

维普数据库检索功能包括:同义词检索;独有的复合检索表达方式;检索字段:可实现对题名、关键词、题名或关键词、文摘、刊名、作者、第一改手毁作者、参考文献、分类号、机构和任意字段等 11个字段进行检索,并可实现各个字段之间的组配检索。

五大文献检索方式:快速检索、传统检索、高级检索、分类检索、期刊导航。特色的参考文献检索入口:可实现与引文数据库的无缝链接操作,在全文库中实现对参考文献的检索。可通过检索参考文献获得源文献,并可查看相应的被引情况、耦合文献等。

⑩ 中国期刊全文数据库检索的途径有那些举例说明如何应用。

有以下途径:初级检索、高级检索、聚类检索、二次检索。

以高级搜索为例进行演示。

工具:电脑。

1、在主页搜索栏的左侧可以看到一个可下拉的框,右侧有“高级检索”侍晌乎山链接,这两个地方都是可以限定条件进行搜索的(图内红框标注)。

2、下拉左侧选项框出现这些选项,可根据需要选定需要搜索的范围,如搜索作者名等等。

3、进入高级检索后选项就更丰富和精确了,可限定搜索文献发表的具体时间段等等。

4、设置好参数后,点击下面的检索进行搜索。

5、老顷锋搜索出来结果后,还有专业检索、句子检索等选项卡(红框标注)。

热点内容
数据库开发入门 发布:2025-04-23 12:13:39 浏览:363
怎么在我的世界国际服中玩服务器 发布:2025-04-23 11:55:59 浏览:972
安卓sav存档怎么改成txt 发布:2025-04-23 11:55:26 浏览:866
密码修改在哪里改 发布:2025-04-23 11:46:48 浏览:787
楚税通里面登陆的密码是设置什么 发布:2025-04-23 11:43:34 浏览:118
复利系统源码 发布:2025-04-23 11:43:33 浏览:252
python微信公众号开发教程 发布:2025-04-23 11:32:22 浏览:429
管理数据库的工具 发布:2025-04-23 11:30:08 浏览:649
存储proc 发布:2025-04-23 11:25:53 浏览:732
内存芯片和存储芯片 发布:2025-04-23 11:08:51 浏览:891