pythonwhoosh

發布時間: 2022-02-26 05:32:33

⑴ 有沒有人用python調用過teststand引擎

搜索引擎框架，有現成的whoosh。這個引擎效率低。如果你把它放在hadoop上，會更慢。如果是你自己寫的引擎。（不包括爬蟲）。可以將分詞部分放到hadoop里去處理。不過建索引還是要rece完成。 python的分詞效率比較低。不過如果你調用的是IT...

⑵ 有誰用過django-haystack中的solr或者whoosh

我用的是haystack+Whoosh實現的搜索功能,網上說solr是java寫的，Xipian是c++寫的，所以用起來比較麻煩，就選用了一個python本身寫的Whoosh。確實方便...
P.S 這個文檔是你說的simon Willison的翻譯版，還不錯：
http //blog csdn net/captain_fhb/article/details/2490294

⑶ 怎麼是用python 語言使用結巴分詞呢

Python代碼

#encoding=utf-8
importjieba

seg_list=jieba.cut("我來到北京清華大學",cut_all=True)
print"FullMode:","/".join(seg_list)#全模式

seg_list=jieba.cut("我來到北京清華大學",cut_all=False)
print"DefaultMode:","/".join(seg_list)#默認模式

seg_list=jieba.cut("他來到了網易杭研大廈")
print",".join(seg_list)

輸出：

FullMode:我/來/來到/到/北/北京/京/清/清華/清華大學/華/華大/大/大學/學

DefaultMode:我/來到/北京/清華大學

他,來到,了,網易,杭研,大廈(此處，「杭研」並沒有在詞典中，但是也被Viterbi演算法識別出來了)

⑷ 用python製作一個搜索引擎

可能幫不上忙。但別的語言有現成的。用java 的 solr做搜索，索引，分詞。只需要配置xml，不用寫代碼。然後加上前端頁面搜索就完成了。用python的scrapy可以做爬蟲。你的需求我感覺簡單做，都不需要索引，直接查資料庫。模糊查詢還有一個java的nutch，幾乎不用寫代碼，直接爬蟲＋索引＋界面一套都實現好了，什麼高亮，快照都有，直接用。不知道你能出多少錢？

⑸ 如何評價whoosh這個python搜索框架

Whoosh 是一個純python實現的全文搜索組件。Whoosh不但功能完善，還非常的快。
Whoosh的作者是MattChaput，由Side Effects Software公司開發。項目的最初用於Houdini（Side Effects Software公司開發的3D動畫軟體）的在線幫助系統。Side Effects Software公司將該項目開源。
主要特性：

* 敏捷的API（Pythonic API）。
* 純python實現，無二進制包。程序不會莫名其妙的崩潰。
* 按欄位進行索引。
* 索引和搜索都非常的快 -- 是目前最快的純python全文搜索引擎。
* 良好的構架，評分模塊/分詞模塊/存儲模塊等各個模塊都是可插拔的。
* 功能強大的查詢語言（通過pyparsing實現功能）。
* 純python實現的拼寫檢查（目前唯一的純python拼寫檢查實現）

為啥選擇Whoosh

* 純python實現，省了編譯二進制包的繁瑣過程。
* python代碼比java更容易讀懂，而且用起來也更方便。（翻者註：這個容易引發口水）
* 在很多時候易用性比單純的最求速度更重要。

Whoosh從其他的開源搜索引擎中獲取了大量的靈感。基礎構建參考Lucene，使用KinoSearch的索引演算法，部分評分演算法來自Terrier，英文的詞語態變化來自Minion.

⑹ python的whoosh中文檢索如何使用

你好，下面是一個例子代碼：

fromwhoosh.qparserimportQueryParser

ix=open_dir("index")

withix.searcher()assearcher:

query=QueryParser("name",ix.schema).parse(u'Chondromyces')

results=searcher.search(query)

forresultinresults:

printresult
#另外你可以考慮到stackoverflow上面去看看。

閱讀全文

熱點內容

java返回this 發布：2025-10-20 08:28:16 瀏覽：841

製作腳本網站發布：2025-10-20 08:17:34 瀏覽：1104

python中的init方法發布：2025-10-20 08:17:33 瀏覽：810

圖案密碼什麼意思發布：2025-10-20 08:16:56 瀏覽：975

怎麼清理微信視頻緩存發布：2025-10-20 08:12:37 瀏覽：864

c語言編譯器怎麼看執行過程發布：2025-10-20 08:00:32 瀏覽：1215

郵箱如何填寫發信伺服器發布：2025-10-20 07:45:27 瀏覽：437

shell腳本入門案例發布：2025-10-20 07:44:45 瀏覽：317

怎麼上傳照片瀏覽上傳發布：2025-10-20 07:44:03 瀏覽：995

python股票數據獲取發布：2025-10-20 07:39:44 瀏覽：960

pythonwhoosh

與pythonwhoosh相關的資訊