資料庫全文檢索
① 全文檢索怎麼實現
要實現全文檢索需要2個必要的條件:一是需要將最終信息本身輸入到計算機里,這個問題看似簡單,實際上它包含了極大的工作量;二是需要有相應的軟體支持,全文信息不僅包括書刊的文字信息,而且包括圖片、聲音、視頻信息等各種信息資料,即使只將書刊及各種資料的文字信息輸入計則老算機,其信息量就非常大了。
全文檢索目前主要通過以下方式來實現:
①採用自由指定的檢索項(如關鍵詞、字元串等)直接基鍵與全文文本的一次數據高速對照,進行檢索;
②對文本內容中的每個檢索項進行位置掃描,然後排序,建立以每個檢索項的離散碼為表目的倒排文檔;
③採用超文本模孫鋒升型建立全文資料庫,實現超文本檢索。
② 中國期刊全文資料庫檢索的途徑有那些舉例說明如何應用。
有以下途徑:
1、初級檢索
初級檢索能進行快速方便的查詢,適用於不熟悉多條件組合查詢或sql語句查詢的用戶,它為用戶提供了詳細的導航,最大范圍的選擇空間。
2、高級檢索
利用高級檢索系統能進行快速有效的組合查詢,優點是查詢結果冗餘少,命中率高。
3、聚類檢索
檢索與本篇文章具有相同分類號的文章。
4、二次檢滑爛索
5、分類檢索分類檢索利用導航體系逐步細化,最終檢索出最小知識單元中包含的論文,這種檢索方式主要使用導航區。
舉其中的例子,檢索有關「社區管理」2005年至今的期刊全部文獻。
初級檢索的具體步驟如下:
1、進入中國期刊全文檢索,選擇檢索項「主題」,輸入檢索詞「社區管理」 ;選擇從「2005」到「2011」,選擇「更新」中的「全部數據 』。
③ 在資料庫中使用全文索引的好外與壞處
好處上面已經說了。最大的優點其實就是檢索速度快,對伺服器的負荷降低
缺點,如果說有的話,就是需要進行填充
上一次填充後,你增加的內容,直到你再次增量填充,否則是檢索不到的。
你可以根據自己更新內容的頻率設置調度來自動執行。
④ 常用的中文文獻檢索資料庫有哪些
1、中國知網:
知網,是國家知識基礎設施的概念,由世界銀行於1998年提出。CNKI工程是以實現全社會知識資源傳播共享與增值利用為目標的信息化建設項目。由清華大學、清華同方發起,始建於1999年6月。
憑借優質的內容資源、領先的技術和專業的服務,中國知網在業界享有極高的聲譽,在2007年,中國知網旗下的《中國學術期刊網路出版總庫》獲首屆「中國出版政府獎」,《中國博士學位論文全文資料庫》、《中國年鑒網路出版總庫》獲提名獎。
2、萬方:
萬方資料庫是由萬方數據公司開發的,涵蓋期刊、會議紀要、論文、學術成果、學術會議論文的大型網路資料庫;也是和中國知網齊名的中國專業的學術資料庫。
其開發公司——萬方數據股份有限公司是國內第一家以信息服務為核心的股份制高新技術企業,是在互聯網領域,集信息資源產品、信息增值服務和信息處理方案為一體的綜合信息服務商。
3、中國年鑒網路出版總庫
中國年鑒網路出版總庫是目前國內最大的連續更新的動態年鑒資源全文資料庫。內容覆蓋基本國情、地理歷史、政治軍事外交、法律、經濟、科學技術、教育、文化體育事業、醫療衛生、社會生活、人物、統計資料、文件標准與法律法規等各個領域。
4、中國引文資料庫
該庫收錄了中國學術期刊(光碟版)電子雜志社出版的所有源資料庫產品的參考文獻,涉及期刊類型、學位論文類型、會議論文類型、圖書類型、專利類型、標准類型、報紙類型等超千萬次被引文獻。
該庫通過揭示各種類型文獻之間的相互引證關系,不僅可以為科學研究提供新的交流模式,同時也可以作為一種有效的科學管理及評價工具。
5、維普資料庫系統
維普資訊網建成於2000年,現已成為全球著名的中文信息服務網站,是Google Scholar最大的中文內容合作網站,中國最大的數字期刊資料庫,目前擁有2000餘家集團用戶,網站注冊用戶數超過200餘萬。
網站內容服務包括9000餘種/2000萬篇中文期刊全文;30餘個國家/11300餘種/800餘萬條外文期刊文獻;400多種重要中文報紙信息,學科覆蓋理、工、農、醫、文、史、哲、法各個領域,並提供網上每日更新。
⑤ 如何用C#實現資料庫全文檢索
目前行業網站的全文檢索的方式主要有兩種
方式一:通過資料庫自帶的全文索引
方式二:通過程序來自建全文索引系統
以sql server 2005為例
2005本身就自帶全文索引功能,你可以先對資料庫表
建立索引,具體如何建索引網上搜索一下,建立完索引之後,你就可以用sql來實現檢索功能,例如:select * from ytbxw where
contaiins(欄位,' 中國');多個查詢值之間可以用and 或
or來實現,在單表以及單表視圖上建全文索引對2005來說根本不是問題,但在多表視圖建全文索引2005目前還無法實現這個功能,拿
www.ytbxw.com為例,其每個欄目的信息都是分開存放的,所以在檢索上就無法用該方法來解決這個問題.
下面重點說一下如何用程序來實現檢索功能
如果你想自己開發一個全文檢索系統,我想這是相當復雜事情,要想實現也不是那麼容易的事情,所以在這里我推薦一套開源程序,那就是dotlucene,我想大家可能都聽過這個東東吧,那我就講講如何來實現多表情況下的全文檢索.
1、新建winform項目,把lucene.net.dll添加到該項目中來
2、創建一個類,類名可以自己取
public class indexer
{
private indexwriter writer;
//在指定路徑下創建索引文件
public indexer(string directory)
{
writer = new indexwriter(directory, new standardanalyzer(), true);
writer.setusecompoundfile(true);
}
//將信息添加到索引文件中
/*
field.text:為索引+讀取
field.unindexed:不需要做索引
*/
public void addhtmldocument(string path,string title,string content)
{
document doc = new document();
doc.add(field.text("text", content));
doc.add(field.unindexed("path", path));
doc.add(field.text("title", title));
writer.adddocument(doc);
}
//解析html,過濾html代碼
private string parsehtml(string html)
{
string temp = regex.replace(html, "<[^>]*>", "");
return temp.replace(" ", " ");
}
//從頁面中獲取文章標題
private string gettitle(string html)
{
match m = regex.match(html, "<title>(.*)</title>");
if (m.groups.count == 2)
return m.groups[1].value;
return "(unknown)";
}
//添加新聞到索引
public void addnews()
{
//從資料庫獲取記錄(這部分略過)
for (int i = 1; i <= pagesize; i++)
{
rootid = int.parse(dr["classid"].tostring().substring(0, 2));
// 寫入索引
addhtmldocument(http://www.ytbxw.com + dr["id"].tostring() + ".html",
dr["title"].tostring(), parsehtml(dr["content"].tostring()));
}/info/
}
//關閉索引
public void close()
{
writer.optimize();
writer.close();
}
}
⑥ 什麼是全文信息檢索
什麼是全文資料庫和全文信息檢索
保存在資料庫中的記錄數據,從類型上可以分為兩種。其一是結構化數據,象字元、日期、數值、貨幣等,這些數據都是具有有限長度或固定格式的數據;其二是非結構化數據,也叫全文數據,象簡歷、簡介、論文等,這些數據都是以不定長、非固定格式保存的字元型數據。
現有的資料庫系統,都是以結構化數據為檢索的主要目標,因為實現相對簡單。比如數值檢索,可以建立一張排序好的索引表,以二分法實現查找,速度很快。但對於非結構化數據,即全文數據,要想實現檢索,相對難度要大的很多了。
當然,你也許會說:「這個多簡單呀,把全文數據讀到內存,然後進行比較查找不就可以了?」。不錯,的確是一個很樸素想法。不過最嚴重的問題是,如果資料庫中有1萬條,10萬條,100萬條記錄的話,可以想像一下檢索所消耗的時間了吧?!如果一個全文資料庫系統,對一條檢索命令的響應時間超過了半分鍾,那麼沒有用戶是能夠容忍的了。
因此,全文檢索的主要目的,就是實現對大容量的非結構化數據的快速查找。
⑦ oracle資料庫實現全文檢索
Oracle全文檢索配置方法:
1.檢查資料庫是否具有全文檢索功能(這是針對已經建成使用的資料庫)
查看用戶中是否存在ctxsys用戶,查詢角色里是否存在ctxapp角色。以上兩個中的1個不滿足(不存在),則說明沒有裝過全文檢索功能。
使用contains函數的時候,若沒有全文檢索則會報錯的。
2.若沒有,則需要手動建立,先建立全文檢索要使用的空間
sqlplus / as sysdba --進入控制台
createtablespaceIdx_ctxsysdatafile'/oradata/sg186fx/ctxsys01.;--創建全文檢索使用的表空間
3.創建全文檢索使用的用戶和角色及相應的包,則需要執行oracle自帶的一個腳本:cd $ORACLE_HOME/ctx/admin/catctx.sql
還是在sqlplus中執行:
@?/ctx/admin/catctx.sql ctxsys Idx_ctxsys temp nolock
在執行這個腳本的時候,輸入了幾個參數,第一個參數ctxsys為ctxsys用戶的密碼
第二個參數Idx_ctxsys為ctxsys用戶要使用的表空間
第三個參數temp為ctxsys用戶使用的臨時表空間
第四個參數nolock為ctxsys用戶處於解鎖狀態。
4.創建完成後,要登錄ctxsys用戶
connect ctxsys/ctxsys
執行以下腳本:@?/ctx/admin/defaults/drdefus.sql(這是個很重要的腳本,後面創建索引會使用該腳本創建的信息)
5.創建全文索引語法分析器
先要明確使用全文索引的用戶,我要使用全文索引的是sgpm用戶
因此
grantexecuteonctxsys.ctx_ddltosgpmwithgrantoption;
connect sgpm/sgpm
設置語法分析器:
execctx_ddl.drop_preference('chinalexer');
execctx_ddl.create_preference('chinalexer','chinese_lexer');
設置詞法屬性:
execctx_ddl.drop_preference('idx_c_store');
begin
ctx_ddl.create_preference('idx_c_store','BASIC_STORAGE');
ctx_ddl.set_attribut('idx_c_store','I_TABLE_CLAUSE','tablespacesIdx_ctxsy');
ctx_ddl.set_attribute('idx_c_store','I_INDEX_CLAUSE','tablespaceIdx_ctxsycompress2');
end;
/
6.創建索引
createindexsgpm.idx_c_cons_nameonsgpm.c_cons(cons_name)indextypeisctxsys.contextparameters('lexerchinalexerstorageidx_c_store');
7.同步索引
variablejobnonumber;
begin
dbms_job.submit(:jobno,'pkg_sp_tools.p_cont_sys_index();',sysdate,'trunc(sysdate)+19/24+1');--執行的是個性化方法。
end;
/
普通的就是用:
execctx_ddl.sync_index('idx_c_cons_name');
到此,全文檢索創建成功,contains函數就可以正常使用了。
注意:創建的過程中會出現ORA-29879:cannot create multiple domain index on a column listusing same indextype ,這說明在其他用戶下已經建立了該索引。
⑧ ebsco全文資料庫有哪些檢索方式
(1)基本檢索
步驟一:輸入檢索詞,可使用上述任意檢索技術。
步驟二:選擇資料庫,以限定在某一資料庫中進行檢索。
步驟三(可選):限制結果,可對檢索結果做進一步限定。包括:全文、是否有參考文獻,是否專家評審刊、出版日期、出版物、頁數、附帶圖像的文章等。還可用相關詞、相關全文來擴大檢索的范圍。
(2)高級檢索
提供所有欄位、著者、文章標題、主題詞、文摘、地名、人名、評論和產品名、公司名、NAICS碼或敘詞、DUNS碼、ISSN號、ISBN號、期刊名稱、索取號等范圍進行檢索。
步驟一:輸入檢索詞,可使用上述任意檢索技術。最多可在三個檢索框中輸入檢索詞進行檢索。
步驟二:選擇檢索欄位,可選擇上述任一檢索欄位。
步驟三:選擇各檢索框的組配方式「and」,「or」,「not」
步驟四:限制結果,可對檢索結果做進一步限定。包括:全文、是否有參考文獻,是否專家評審刊、出版日期、出版物、頁數、附帶圖像的文章等。還可用相關詞、相關全文來擴大檢索的范圍。
(3)視覺檢索
在查找欄位中輸入搜索詞語,然後單擊搜索。這時會顯示一個視覺導航圖,其中包含:
A.柱形,表示結果的類別。類別中可以包括表示子類別的圓柱。單擊某柱形(類別)可查看其內容。
B.矩形,表示文章的鏈接。單擊某矩形可將該文章載入到窗格中。
要在導航圖中向後(或向上)移動,可單擊柱形或矩形的外部。單擊頂部,可查看整個導航圖。
(4)輔助檢索
在檢索頁面的最上方,還提供其它檢索途徑,點擊工具欄的相關按鈕,即可進行輔助檢索。
A.Publications--出版物名稱檢索
使用出版物名稱檢索和瀏覽。檢索結果顯示:刊名、國際統一刊號、更新頻率、價格、出版者、學科、主題、收錄文摘或全文的起始時間等。
B.Subject Terms--規范化主題檢索
利用系統提供的規范化主題詞檢索,可供選擇的主題有:All(所有的主題)、People(人物)、Procts & Books (產品與圖書)、Companies(公司企業)、Subjects(主題),這種方法檢索效率高,相關性大。
C.Cited reference—引文檢索:
可輸入相關檢索詞在被引作者(Cited Author)、被引題名(Cited Title)、被引來源(Cited Source)、被引年限(Cited Year)及所有引用欄位(All Citation Fields)進行引文檢索。
D.索引—索引檢索
首先選擇索引項,可供選擇的索引項有作者、作者提供的關鍵詞、公司名、文獻類型、DUNS碼、日期、地名、主題標目、ISBN、ISSN、期刊名、語種、NAICS碼或敘詞、人名、評論或產品、主題詞、出版年。再在「瀏覽:」後輸入詞語進行定位。
E.Images--圖片檢索:
可輸入檢索詞,並可進行圖像類型(所有類型、人物圖像、自然科學圖像、地理圖像、歷史圖像、地圖和旗幟)的限定。 也可以搜索相關關鍵字、自動 "And" 檢索詞語。
⑨ 維普資料庫的檢索方式有哪幾種
維普資料庫的檢索方式有:「快速檢索」、「傳統檢索」、「高級檢索」、「分類檢索」和「期刊導航」五種檢索方法。
維普資料庫檢索功能介紹:
《中文科技期刊資料庫》採用國內一流檢索內核「尚唯全文檢索系統」實現資料庫的檢索管理。「尚唯全文檢索系統」是經國內專家團隊鑒定一致認為達到「國內領先、國際先進」水平的檢索系統, 各種指標及其綜合性能均大大領先於其核備它同類產品。
維普資料庫檢索功能包括:同義詞檢索;獨有的復合檢索表達方式;檢索欄位:可實現對題名、關鍵詞、題名或關鍵詞、文摘、刊名、作者、第一改手毀作者、參考文獻、分類號、機構和任意欄位等 11個欄位進行檢索,並可實現各個欄位之間的組配檢索。
五大文獻檢索方式:快速檢索、傳統檢索、高級檢索、分類檢索、期刊導航。特色的參考文獻檢索入口:可實現與引文資料庫的無縫鏈接操作,在全文庫中實現對參考文獻的檢索。可通過檢索參考文獻獲得源文獻,並可查看相應的被引情況、耦合文獻等。
⑩ 中國期刊全文資料庫檢索的途徑有那些舉例說明如何應用。
有以下途徑:初級檢索、高級檢索、聚類檢索、二次檢索。
以高級搜索為例進行演示。
工具:電腦。
1、在主頁搜索欄的左側可以看到一個可下拉的框,右側有「高級檢索」侍晌乎山鏈接,這兩個地方都是可以限定條件進行搜索的(圖內紅框標注)。
2、下拉左側選項框出現這些選項,可根據需要選定需要搜索的范圍,如搜索作者名等等。
3、進入高級檢索後選項就更豐富和精確了,可限定搜索文獻發表的具體時間段等等。
4、設置好參數後,點擊下面的檢索進行搜索。
5、老頃鋒搜索出來結果後,還有專業檢索、句子檢索等選項卡(紅框標注)。