當前位置:首頁 » 編程語言 » php分詞搜索

php分詞搜索

發布時間: 2022-10-15 14:09:40

⑴ 如何將php分詞語句變成搜索資料庫來分詞

PHP,一個嵌套的縮寫名稱,是英文超級文本預處理語言(PHP:Hypertext Preprocessor)的縮寫。PHP 是一種 HTML 內嵌式的語言,PHP與微軟的ASP頗有幾分相似,都是一種在伺服器端執行的嵌入HTML文檔的腳本語言

⑵ php怎麼做一個智能搜索呀

首先你要有個詞庫,然後將輸入的內容拆分,然後再全文檢索。技術不難,難就難在如果收集這個詞庫

⑶ 求解,關於PHP搜索分詞的問題!

沒用過織夢。

⑷ wordpress如何實現搜索中文分詞

1、需要大家新建一個搜索頁面,將它命名為:searchform.php
2、直接用DW打開searchform.php,將以下代碼一會補充復制到searchform.php中。

3、復制添加網站主題里邊的wordpress 分類模板目錄,可以是文章的列表目錄,也可以是產品圖片列表目錄,然後更名為search.php,才能實現搜索功能。
4、選擇搜索框顯示的頁面位置,並在相應的位置添加搜索框調用代碼:
<?php include (TEMPLATEPATH . searchform.php'); ?>
按照以上步驟全部完成之後,就可以在自己的網站上實現搜索功能了。

⑸ PHP中文分詞 自動獲取關鍵詞介紹

復制代碼
代碼如下:
<?php
header("Content-Type:text/html;
charset=utf-8");
define('APP_ROOT',
str_replace('\\',
'/',
dirname(__FILE__)));
$test
=
'這里是一段中文測試代碼!';
function
get_tags_arr($title)
{
require(APP_ROOT.'/pscws4.class.php');
$pscws
=
new
PSCWS4();
$pscws->set_dict(APP_ROOT.'/scws/dict.utf8.xdb');
$pscws->set_rule(APP_ROOT.'/scws/rules.utf8.ini');
$pscws->set_ignore(true);
$pscws->send_text($title);
$words
=
$pscws->get_tops(5);
$tags
=
array();
foreach
($words
as
$val)
{
$tags[]
=
$val['word'];
}
$pscws->close();
return
$tags;
}
print_r(get_tags_arr($test));
//============================================================
function
get_keywords_str($content){
require(APP_ROOT.'/phpanalysis.class.php');
PhpAnalysis::$loadInit
=
false;
$pa
=
new
PhpAnalysis('utf-8',
'utf-8',
false);
$pa->LoadDict();
$pa->SetSource($content);
$pa->StartAnalysis(
false
);
$tags
=
$pa->GetFinallyResult();
return
$tags;
}
print(get_keywords_str($test));
相關下載地址
SCWS

簡易中文分詞系統
SCWS
在概念上並無創新成分,採用的是自行採集的詞頻詞典,並輔以一定程度上的專有名稱、人名、地名、數字年代等規則集,經小范圍測試大概准確率在
90%
~
95%
之間,已能基本滿足一些中小型搜索引擎、關鍵字提取等場合運用。
SCWS
採用純
C
代碼開發,以
Unix-Like
OS
為主要平台環境,提供共享函數庫,方便植入各種現有軟體系統。此外它支持
GBK,UTF-8,BIG5
等漢字編碼,切詞效率高。
系統平台:Windows/Unix
開發語言:C
使用方式:PHP擴展
演示網址:http://www.ftphp.com/scws/demo.php
開源官網:http://www.ftphp.com/scws/
晴楓附註:作為PHP擴展,容易與現有的基於PHP架構的Web系統繼續集成,是其一大優勢。
PhpanAlysis -
PHP無組件分詞系統
PhpanAlysis分詞系統是基於字元串匹配的分詞方法
,這種方法又叫做機械分詞方法,它是按照一定的策略將待分析的漢字串與一個「充分大的」機器詞典中的詞條進行配,若在詞典中找到某個字元串,則匹配成功(識別出一個詞)。按照掃描方向的不同,串匹配分詞方法可以分為正向匹配
和逆向匹配;按照不同長度優先匹配的情況,可以分為最大(最長)匹配和最小(最短)匹配;按照是否與詞性標注過程相結合,又可以分為單純分詞方法和分詞與標注相結合的一體化方法。
系統平台:PHP環境
開發語言:PHP
使用方式:HTTP服務
演示網址:http://www.itgrass.com/phpanalysis/
開源官網:http://www.itgrass.com/phpanalysis/
晴楓附註:實現簡單,容易使用,能做一些簡單應用,但大數據量的計算效率不如前幾種。
試用了幾個系統,基本分詞功能都沒什麼問題,只是在個別一些詞的劃分上存在一些差異;對於詞性的確定,系統間有所不同。
http://www.jb51.net/codes/40139.html

⑹ php 分詞,搜索引擎,技術

你好,很高興為你解答:

如果你僅僅是要把長句中的單詞分出來,那是很簡單的:

<?php
$str="GoogleTranslateforBusiness!";
$str=preg_replace("{.|,|;|:|'|"|?|!|<|>|(|)}","",$str);//移除所有標點符號
$arr=array_unique(explode("",$str));//以空格分割,並去重
var_mp($arr);
?>

以下是一段測試文本:

(asseeninCorPerl),"something"(inthiscase,output"Hi,I'maPHPscript!").<?phpand?>"PHPmode."
-,.,.,andthenthere'.
,.Don''sfeatures.Youcanjumpin,inashorttime,.
AlthoughPHP'sdevelopmentisfocusedonserver-sidescripting,youcandomuchmorewithit.Readon,andseemoreintheWhatcanPHPdo?section,.

輸出結果:

Instead,of,lots,commands,to,output,HTML,as,seen,in,C,or,Perl,PHP,pages,contain,with,embedded,code,that,does,something,this,case,Hi,Im,a,script,The,is,enclosed,special,start,and,end,processing,instructions,php,,allow,you,jump,into,out,modeWhat,distinguishes,from,like,client-side,JavaScript,the,executed,on,server,generating,which,then,sent,client,would,receive,results,running,but,not,know,what,underlying,was,You,can,even,configure,your,web,process,all,files,theres,really,no,way,users,tell,have,up,sleeveThe,best,things,using,are,it,extremely,simple,for,newcomer,offers,many,advanced,features,professional,programmer,Dont,be,afraid,reading,long,list,PHPs,short,time,writing,scripts,few,hoursAlthough,development,focused,server-side,scripting,do,much,more,Read,see,What,section,go,right,introctory,tutorial,if,only,interested,programming

使用sort()對其進行排序:

C,Dont,HTML,Hi,Im,Instead,JavaScript,PHP,PHPs,Perl,Read,The,What,You,a,advanced,afraid,all,allow,and,are,as,be,best,but,can,case,client,client-side,code,commands,configure,contain,development,distinguishes,do,does,embedded,enclosed,end,even,executed,extremely,features,few,files,focused,for,from,generating,go,have,hoursAlthough,if,in,instructions,interested,into,introctory,is,it,jump,know,like,list,long,lots,many,modeWhat,more,much,newcomer,no,not,of,offers,on,only,or,out,output,pages,php,process,processing,professional,programmer,programming,reading,really,receive,results,right,running,script,scripting,scripts,section,see,seen,sent,server,server-side,short,simple,sleeveThe,something,special,start,tell,that,the,then,theres,things,this,time,to,tutorial,underlying,up,users,using,was,way,web,what,which,with,would,writing,you,your

-----------------------------------
如有疑問歡迎追問!
滿意請點擊右上方【選為滿意回答】按鈕么么噠 o(∩_∩)o

⑺ php怎麼實現搜索高亮,注意是分開的字元

這個是使用正則匹配的。
第一 你得判斷 要飄紅的是1個關鍵詞 還是多個關鍵詞,如果是多個的關鍵詞的話,用一個foreach 循環替換,如果是一個關鍵詞 直接 替換就可以了
$title = preg_replace($pattern, $replacement, $subject);

⑻ PHP中文分詞應用到搜索的例子

中文分詞,首先對您輸入的搜索關鍵字進行分詞,然後資料庫中本來就存在一個索引表,就像個詞典,然後當你進行搜索的時候就用你的詞去和那本字典對比,得到索引結果表,然後通過id類似於偏移地址,得到真正的數據源地址,反饋回來,這是我平時做搜索的方法,希望對你有用。順便插播個小廣告bbs.45net.cn。有時間捧個人場。O(∩_∩)O~

⑼ PHP能做到中文分詞嗎

只要能處理字元竄的程序多能做中文分詞, 只是效率問題

其實PHP不適合做中文分詞,執行效率太低

只能是簡單的應用,比如用戶搜索的時候把,把用戶搜索到的關鍵字分離出來加亮啥的

所謂的分詞,是把一句話里有意義的詞語提取出來

比如:

他在游泳 分詞的時候把 他 和 游泳 這兩個字分離出來

不能把游泳 分成 游 和 泳
這個設計到語義分析,概率,啥啥的,很麻煩

中文分詞是中文搜索引擎必須的

熱點內容
安卓手機玩mc卡怎麼辦 發布:2024-12-23 12:15:46 瀏覽:5
mt編譯時出現錯誤信息 發布:2024-12-23 12:15:45 瀏覽:107
雙存儲冗餘 發布:2024-12-23 12:09:16 瀏覽:664
解壓縮太慢 發布:2024-12-23 12:08:36 瀏覽:535
linux恢復誤刪文件 發布:2024-12-23 11:59:36 瀏覽:493
平板電腦賬號登錄伺服器錯誤 發布:2024-12-23 11:41:07 瀏覽:99
金蝶kis專業版資料庫表 發布:2024-12-23 11:35:41 瀏覽:602
相冊已經加密如何改密碼 發布:2024-12-23 11:32:20 瀏覽:277
批量下載鏈接腳本 發布:2024-12-23 11:29:11 瀏覽:973
PHP畫a夢 發布:2024-12-23 11:28:01 瀏覽:199