全文資料庫檢索
A. 什麼是全文資料庫
全文資料庫即收錄有原始文獻全文的資料庫。
全文資料庫以期刊論文、會議論文、政府出版物如政令文件等、研究報告、法律條文和案例、商業信息等為主。全文資料庫免去了文獻標引著錄等加工環節,減少了數據組織中的人為因素,因此數據更新速度快,檢索結果查准率更高;同時由於直接提供全文,省去了找到原文的麻煩,因此深受用戶喜愛。
全文資料庫具有強大的檢索功能,表現在它能提供豐富的檢索點,允許用戶從信息載體的人名、地名、年代、關鍵詞等多個角度進行單項檢索或多項組配檢索,甚至可對文本中任意欄位進行檢索。
(1)全文資料庫檢索擴展閱讀:
全文資料庫的作用
1、檢索功能:全文資料庫具有強大的檢索功能,表現在它能提供豐富的檢索點,允許用戶從信息載體的人名、地名、年代、關鍵詞等多個角度進行單項檢索或多項組配檢索,甚至可對文本中任意欄位進行檢索,甚至還可以進行字元檢索等, 如布爾運算。
2、信息分析功能:全文資料庫具有一定的信息分析功能,可對檢索結果再次處理,以進行人名、地名、關鍵詞等的聚類、統計排序。
3、信息統計功能:全文資料庫還具有一定的信息計量功能,可對文本中的人名、地名、關鍵詞等進行頻率統計並排序,如根據檢索的關鍵詞生成搜索大數據等為決策等提供依據等。
B. 什麼是全文信息檢索
什麼是全文資料庫和全文信息檢索
保存在資料庫中的記錄數據,從類型上可以分為兩種。其一是結構化數據,象字元、日期、數值、貨幣等,這些數據都是具有有限長度或固定格式的數據;其二是非結構化數據,也叫全文數據,象簡歷、簡介、論文等,這些數據都是以不定長、非固定格式保存的字元型數據。
現有的資料庫系統,都是以結構化數據為檢索的主要目標,因為實現相對簡單。比如數值檢索,可以建立一張排序好的索引表,以二分法實現查找,速度很快。但對於非結構化數據,即全文數據,要想實現檢索,相對難度要大的很多了。
當然,你也許會說:「這個多簡單呀,把全文數據讀到內存,然後進行比較查找不就可以了?」。不錯,的確是一個很樸素想法。不過最嚴重的問題是,如果資料庫中有1萬條,10萬條,100萬條記錄的話,可以想像一下檢索所消耗的時間了吧?!如果一個全文資料庫系統,對一條檢索命令的響應時間超過了半分鍾,那麼沒有用戶是能夠容忍的了。
因此,全文檢索的主要目的,就是實現對大容量的非結構化數據的快速查找。
C. 什麼是全文資料庫(full-text database)
一般用在文件檢索方面,所謂全文是與一般的資料庫比較而言的。一般的資料庫中存儲的只是某個文件的關鍵字,查找時也只能按照關鍵字去查找,而對於全文資料庫,其中包含的是整個文章的內容。因此,在查詢時,一般採用的是模糊查詢。這樣可以更多的涉及到文章的內容。
D. 常用的中文文獻檢索資料庫有哪些
1、中國知網:
知網,是國家知識基礎設施的概念,由世界銀行於1998年提出。CNKI工程是以實現全社會知識資源傳播共享與增值利用為目標的信息化建設項目。由清華大學、清華同方發起,始建於1999年6月。
憑借優質的內容資源、領先的技術和專業的服務,中國知網在業界享有極高的聲譽,在2007年,中國知網旗下的《中國學術期刊網路出版總庫》獲首屆「中國出版政府獎」,《中國博士學位論文全文資料庫》、《中國年鑒網路出版總庫》獲提名獎。
2、萬方:
萬方資料庫是由萬方數據公司開發的,涵蓋期刊、會議紀要、論文、學術成果、學術會議論文的大型網路資料庫;也是和中國知網齊名的中國專業的學術資料庫。
其開發公司——萬方數據股份有限公司是國內第一家以信息服務為核心的股份制高新技術企業,是在互聯網領域,集信息資源產品、信息增值服務和信息處理方案為一體的綜合信息服務商。
3、中國年鑒網路出版總庫
中國年鑒網路出版總庫是目前國內最大的連續更新的動態年鑒資源全文資料庫。內容覆蓋基本國情、地理歷史、政治軍事外交、法律、經濟、科學技術、教育、文化體育事業、醫療衛生、社會生活、人物、統計資料、文件標准與法律法規等各個領域。
4、中國引文資料庫
該庫收錄了中國學術期刊(光碟版)電子雜志社出版的所有源資料庫產品的參考文獻,涉及期刊類型、學位論文類型、會議論文類型、圖書類型、專利類型、標准類型、報紙類型等超千萬次被引文獻。
該庫通過揭示各種類型文獻之間的相互引證關系,不僅可以為科學研究提供新的交流模式,同時也可以作為一種有效的科學管理及評價工具。
5、維普資料庫系統
維普資訊網建成於2000年,現已成為全球著名的中文信息服務網站,是Google Scholar最大的中文內容合作網站,中國最大的數字期刊資料庫,目前擁有2000餘家集團用戶,網站注冊用戶數超過200餘萬。
網站內容服務包括9000餘種/2000萬篇中文期刊全文;30餘個國家/11300餘種/800餘萬條外文期刊文獻;400多種重要中文報紙信息,學科覆蓋理、工、農、醫、文、史、哲、法各個領域,並提供網上每日更新。
E. oracle資料庫實現全文檢索
Oracle全文檢索配置方法:
1.檢查資料庫是否具有全文檢索功能(這是針對已經建成使用的資料庫)
查看用戶中是否存在ctxsys用戶,查詢角色里是否存在ctxapp角色。以上兩個中的1個不滿足(不存在),則說明沒有裝過全文檢索功能。
使用contains函數的時候,若沒有全文檢索則會報錯的。
2.若沒有,則需要手動建立,先建立全文檢索要使用的空間
sqlplus / as sysdba --進入控制台
createtablespaceIdx_ctxsysdatafile'/oradata/sg186fx/ctxsys01.;--創建全文檢索使用的表空間
3.創建全文檢索使用的用戶和角色及相應的包,則需要執行oracle自帶的一個腳本:cd $ORACLE_HOME/ctx/admin/catctx.sql
還是在sqlplus中執行:
@?/ctx/admin/catctx.sql ctxsys Idx_ctxsys temp nolock
在執行這個腳本的時候,輸入了幾個參數,第一個參數ctxsys為ctxsys用戶的密碼
第二個參數Idx_ctxsys為ctxsys用戶要使用的表空間
第三個參數temp為ctxsys用戶使用的臨時表空間
第四個參數nolock為ctxsys用戶處於解鎖狀態。
4.創建完成後,要登錄ctxsys用戶
connect ctxsys/ctxsys
執行以下腳本:@?/ctx/admin/defaults/drdefus.sql(這是個很重要的腳本,後面創建索引會使用該腳本創建的信息)
5.創建全文索引語法分析器
先要明確使用全文索引的用戶,我要使用全文索引的是sgpm用戶
因此
grantexecuteonctxsys.ctx_ddltosgpmwithgrantoption;
connect sgpm/sgpm
設置語法分析器:
execctx_ddl.drop_preference('chinalexer');
execctx_ddl.create_preference('chinalexer','chinese_lexer');
設置詞法屬性:
execctx_ddl.drop_preference('idx_c_store');
begin
ctx_ddl.create_preference('idx_c_store','BASIC_STORAGE');
ctx_ddl.set_attribut('idx_c_store','I_TABLE_CLAUSE','tablespacesIdx_ctxsy');
ctx_ddl.set_attribute('idx_c_store','I_INDEX_CLAUSE','tablespaceIdx_ctxsycompress2');
end;
/
6.創建索引
createindexsgpm.idx_c_cons_nameonsgpm.c_cons(cons_name)indextypeisctxsys.contextparameters('lexerchinalexerstorageidx_c_store');
7.同步索引
variablejobnonumber;
begin
dbms_job.submit(:jobno,'pkg_sp_tools.p_cont_sys_index();',sysdate,'trunc(sysdate)+19/24+1');--執行的是個性化方法。
end;
/
普通的就是用:
execctx_ddl.sync_index('idx_c_cons_name');
到此,全文檢索創建成功,contains函數就可以正常使用了。
注意:創建的過程中會出現ORA-29879:cannot create multiple domain index on a column listusing same indextype ,這說明在其他用戶下已經建立了該索引。
F. 中國期刊全文資料庫檢索的途徑有那些舉例說明如何應用。
有以下途徑:初級檢索、高級檢索、聚類檢索、二次檢索。
以高級搜索為例進行演示。
工具:電腦。
1、在主頁搜索欄的左側可以看到一個可下拉的框,右側有「高級檢索」鏈接,這兩個地方都是可以限定條件進行搜索的(圖內紅框標注)。
G. ebsco全文資料庫有哪些檢索方式
(1)基本檢索
步驟一:輸入檢索詞,可使用上述任意檢索技術。
步驟二:選擇資料庫,以限定在某一資料庫中進行檢索。
步驟三(可選):限制結果,可對檢索結果做進一步限定。包括:全文、是否有參考文獻,是否專家評審刊、出版日期、出版物、頁數、附帶圖像的文章等。還可用相關詞、相關全文來擴大檢索的范圍。
(2)高級檢索
提供所有欄位、著者、文章標題、主題詞、文摘、地名、人名、評論和產品名、公司名、NAICS碼或敘詞、DUNS碼、ISSN號、ISBN號、期刊名稱、索取號等范圍進行檢索。
步驟一:輸入檢索詞,可使用上述任意檢索技術。最多可在三個檢索框中輸入檢索詞進行檢索。
步驟二:選擇檢索欄位,可選擇上述任一檢索欄位。
步驟三:選擇各檢索框的組配方式「and」,「or」,「not」
步驟四:限制結果,可對檢索結果做進一步限定。包括:全文、是否有參考文獻,是否專家評審刊、出版日期、出版物、頁數、附帶圖像的文章等。還可用相關詞、相關全文來擴大檢索的范圍。
(3)視覺檢索
在查找欄位中輸入搜索詞語,然後單擊搜索。這時會顯示一個視覺導航圖,其中包含:
A.柱形,表示結果的類別。類別中可以包括表示子類別的圓柱。單擊某柱形(類別)可查看其內容。
B.矩形,表示文章的鏈接。單擊某矩形可將該文章載入到窗格中。
要在導航圖中向後(或向上)移動,可單擊柱形或矩形的外部。單擊頂部,可查看整個導航圖。
(4)輔助檢索
在檢索頁面的最上方,還提供其它檢索途徑,點擊工具欄的相關按鈕,即可進行輔助檢索。
A.Publications--出版物名稱檢索
使用出版物名稱檢索和瀏覽。檢索結果顯示:刊名、國際統一刊號、更新頻率、價格、出版者、學科、主題、收錄文摘或全文的起始時間等。
B.Subject Terms--規范化主題檢索
利用系統提供的規范化主題詞檢索,可供選擇的主題有:All(所有的主題)、People(人物)、Procts & Books (產品與圖書)、Companies(公司企業)、Subjects(主題),這種方法檢索效率高,相關性大。
C.Cited reference—引文檢索:
可輸入相關檢索詞在被引作者(Cited Author)、被引題名(Cited Title)、被引來源(Cited Source)、被引年限(Cited Year)及所有引用欄位(All Citation Fields)進行引文檢索。
D.索引—索引檢索
首先選擇索引項,可供選擇的索引項有作者、作者提供的關鍵詞、公司名、文獻類型、DUNS碼、日期、地名、主題標目、ISBN、ISSN、期刊名、語種、NAICS碼或敘詞、人名、評論或產品、主題詞、出版年。再在「瀏覽:」後輸入詞語進行定位。
E.Images--圖片檢索:
可輸入檢索詞,並可進行圖像類型(所有類型、人物圖像、自然科學圖像、地理圖像、歷史圖像、地圖和旗幟)的限定。 也可以搜索相關關鍵字、自動 "And" 檢索詞語。