php正則匹配html
1. 如何用php 正則匹配出含有HTML標簽的字元串中的英文單詞
通過仔細閱讀問題描述,樣本採用 html格式編寫,其內容為中英文互譯,如問題所要求的:「正文中的,英文單詞都匹配出來」。
提供一下思路:
建議可以將問題簡化一下,即只取正文中的英文部分。
通過觀察如上提供的樣本中,大部分的英文部分都以標簽<div class="set_en">...</div>(其中有一個 div標簽沒有配對) ,則步驟如下:
1、先編寫正則取出標簽中的內容:
2. php正則表達來獲取html中的部分內容
1、幾種函數的簡單說明:
(1)preg_grep -- 返回與模式匹配的數組單元
preg_grep 返回一個input 數組中與給定的 pattern 模式相匹配的單元所組成的數組。
(2)preg_match -- 進行正則表達式匹配
說明:int preg_match ( string pattern, string subject [, array matches [, int flags]] )在 subject 字元串中搜索與 pattern 給出的正則表達式相匹配的內容。 返回值0或1。
(3)preg_replace -- 執行正則表達式的搜索和替換
(4)preg_split -- 用正則表達式分割字元串
2. 一般來說,如果用正則來獲取匹配內容,一般使用 preg_match/ preg_match_all 函數。
補充回答:
正則表達式如下:
'%<div class="wap2"><span>功能</span>(.*?)</div>%si'
以下是代碼,經測試,運行正常:
<?php
$str = '<div class="wap2"><span>功能</span>這裡面是要獲取的內容,不能確定什麼字元,可能是數字(123456…)字母(badn…),特殊浮等(o_O\(^o^)/…)</div>';
$pa = '%<div class="wap2"><span>功能</span>(.*?)</div>%si';
preg_match($pa,$str,$r);
echo $r[1];
?>
3. PHP正則表達式匹配0個或多個指定的字元
proct-1349.html
是對應 test.php?action=proct&rid=1349
那
proct.html
的rid怎麼辦?為 空?
RewriteRule ^/?([a-zA-Z]{1,})(-([0-9]{1,}))?\.html$ test.php?action=$1&rid=$3
123456789