當前位置:首頁 » 編程語言 » php正則查找

php正則查找

發布時間: 2022-11-29 11:01:54

php 正則獲取網站內容

我寫好了,用Dreamweaver調試過,可以匹配。

先用下面正則提取需要的代碼段:

DrawResult.+?>(d{1,2})</td>.+?>(d{1,2})</td>.+?>(d{1,2})</td>.+?>(d{1,2})</td>.+?>(d{1,2})</td>.+?>(d{1,2})</td>

再用正則替換,把該內容中除了數字以外的代碼去除:

替換成$1,$2,$3,$4,$5,$6 即可得到 4,7,8,33,36,43

Ⅱ php 正則匹配 根據上一行的關鍵字找到下一行 特定值

正則表達式是說字元串按照一定的格式的匹配,並不是無中生有。owner_gfxip_gfx9_fireflight_quick 跟328916 沒有任何關系。

Ⅲ PHP正則表達式參數 /i,/g,/ig,/gi,/m的區別和含義

i不區分大小寫
g貌似不存在吧
m多行模式,即字元串中的每一行開始和結束都能分別被^和$匹配,普通情況下^和$匹配整個
字元串的開頭和結束。

更多資料,可以參考我的博客《我眼裡的正則表達式(入門)》

鏈接:http://www.zjmainstay.cn/my-regexp

Ⅳ php正則表達式查找html內容

php正則表達式查找html內容的方法:
preg_match('/<p align=\"center\"><big><strong>(.*?)<\/strong><\/big><\/p>/',$str,$result);
代碼解釋:
$str就是上面的html裡面的內容;
$result就是匹配到的字元串,可以print_r($result);看看裡面就有你要的結果,或者直接echo $result[1];
就是「在LINUX下配置MYSQL、PHP和JSP」這幾個字元了。

Ⅳ phpstorm正則查找能區分大小寫嗎

正則本身就有簡便的大小寫區分匹配寫法,沒必要用選項判斷。[A-z]這個是不區分大小寫24個字母[a-z]純小寫[A-Z]純大寫無非就這三種

Ⅵ PHP 正則表達式總結

PHP 正則表達式總結

1.PHP中兩個常用的正則函數

a.preg_match 正則函數,以perl語言為基礎

語法:preg_match( mode,string subject,array matches)

說明:mode參數---- 正則的模塊,也就是正則表達式(語法)

subject參數---- 正則的內容

matches參數---- 正則的結果(獲得一個數組的形式)

b.ereg 正則函數,以POSIX基礎(Unix、Script)

語法:ereg(mode ,string subject, array regs)

2.正則表達式中包括的元素

a.原子(普通字元:a-z A-Z 0-9 、原子表、轉義字元)

b.元字元(有特殊功能的字元,如:# 、*)

c.模式修正符(系統內置部分字元 i、m、S、U ...)

3.正則表達式中的「原子」

a.a-z A-Z _ 0-9 //最常見的字元

b.(abc)(skd) //用圓括弧包含起來的單元符號(一個整體)

c.[abcs][^abd] //用方括弧包含的原子表,原子表中的^代表排除或相反的內容

d.轉義字元

d 包含所有的數字[0-9]

D 除所有數字外[^0-9]

w 包含所有英文字元[a-z A-Z 0-9]

W 除所有英文字元外[^a-z A-Z 0-9]

s 回車,換行等

......

註明: 圓括弧 必須是整體才能匹配; 方括弧 只要是其子集,都可以匹配(內容存在)

4.正則表達式元字元

* 匹配前一個內容的0次1次或多次

. 匹配內容的0次1次或多次,但不包含回車換行(代指自己,任何內容)

+ 匹配前一個內容的1次或多次

? 匹配前一個內容的.0次或1次

| 選擇匹配類似PHP中的| (因為這個運算符合是弱類型導致前面最為整體匹配,類似一個單詞匹配)

^ 匹配字元串首部內容

$ 匹配字元串尾部內容

b 匹配單詞邊界,邊界可以是空格或者特殊符合(有單詞分界符,類似空格)

B 匹配除帶單詞邊界意外內容(無單詞分界符)

{m} 匹配前一個內容的重復次數為M次

{m,} 匹配前一個內容的重復次數大於等於M次

{m,n} 匹配前一個內容的重復次數M次到N次

( ) 合並整體匹配,並放入內存,可使用1 2…依次獲取 (調用放入內存中的內容)

5.運算順序

依然遵循從左到→右的運算規則

優先順序:

( ) 圓括弧因為是內存處理所以最高

* ? + { } 重復匹配內容其次

^ $ b 邊界處理第三

| 條件處理第四

最後按照運算順序計算匹配

6.模式修正符

模式修正符是為正則表達式增強和補充的一個功能,使用在正則之外 例如:/ 正則 / U

常用修正符:

i 正則內容在匹配時候不區分大小寫(默認是區分的)

m 在匹配首內容或者尾內容時候採用多行識別匹配

s 將轉義回車取消是為單行匹配如. 匹配的時候

x 忽略正則中的空白

A 強制從頭開始匹配

D 強制$匹配尾部無任何內容 n

U 禁止貪婪匹配 只跟蹤到最近的一個匹配符並結束, 常用在採集程序上的正則表達式

7.匹配功能

preg_match_all 全部匹配函數

語法:preg_match_all ( string pattern, string subject, array matches [, int flags] )

說明:對結果排序使 $matches[0] 為全部模式匹配的數

用途:截取比較詳細的內容,採集網頁,分析文本

8.替換功能

preg_replace 正則替換函數

語法:preg_replace ( mixed pattern, mixed replacement, mixed subject [, int limit] )

說明:通過正則表達式來替換相關內容,類似之前學過的str_replace字元串替換,但 功能要強於它

提示:1、替換內容可以是一個正則也可以是數組正則

2、替換內容可以通過修正符e來解決替換執行內容

用途:替換一些比較復雜的內容上,也可以用於內容的轉換上

9.分割功能

preg_split 正則切割

語法:preg_split ( string pattern, string subject [, int limit [, int flags]] )

說明:通過正則表達式來切割相關內容,類似之前學過的explode切割函數,但explode 只能按照一種方式切割有局限性。

;

Ⅶ php正則表達式按關鍵字搜索文件

$list=scandir('./help');$key=$_GET['k'];$dir=$_GET['dir'];//文件目錄,可以指定

function
key_search($dir){global
$key;

$list=scandir($dir);

if($list){

foreach($list
as
$v){

if($v!='.'
or
$v!='..'){

$f=$dir.$v;

if(
is_dir

($f)){scandir($f);}else{

if(!stristr($v,$key)){echo
$v;}

}

}

}

}else{echo
$dir.'文件夾不存在';}

注:1,程序請自行測試

2,子目錄可能需要檢查最後字元是否為/,如果不是,則添加。

3,你的說明很有問題,一會兒要找,一會又說不包含。

}

Ⅷ 如何用PHP 正則匹配出含有HTML標簽的字元串中的英文單詞

通過仔細閱讀問題描述,樣本採用 html格式編寫,其內容為中英文互譯,如問題所要求的:「正文中的,英文單詞都匹配出來」。

提供一下思路:

建議可以將問題簡化一下,即只取正文中的英文部分。

通過觀察如上提供的樣本中,大部分的英文部分都以標簽<div class="set_en">...</div>(其中有一個 div標簽沒有配對) ,則步驟如下:

1、先編寫正則取出標簽中的內容:

Ⅸ 一個關於PHP正則的問題:

匹配漢字的最終正確表達式
花括弧中間的「-」表示範圍
前面的花括弧是開始字元,後面的花括弧是表示結束
就是說從4e00開始到9fa5

這是匹配漢字的最終正確表達式

參考:http://ke..com/link?url=_
正則表達式,又稱正規表示法、常規表示法(英語:Regular Expression,在代碼中常簡寫為regex、regexp或RE),計算機科學的一個概念。正則表達式使用單個字元串來描述、匹配一系列符合某個句法規則的字元串。在很多文本編輯器里,正則表達式通常被用來檢索、替換那些符合某個模式的文本。
正則表達式是對字元串操作的一種邏輯公式,就是用事先定義好的一些特定字元、及這些特定字元的組合,組成一個「規則字元串」,這個「規則字元串」用來表達對字元串的一種過濾邏輯。
給定一個正則表達式和另一個字元串,我們可以達到如下的目的:
1. 給定的字元串是否符合正則表達式的過濾邏輯(稱作「匹配」);
2. 可以通過正則表達式,從字元串中獲取我們想要的特定部分。
正則表達式的特點是:
1. 靈活性、邏輯性和功能性非常的強;
2. 可以迅速地用極簡單的方式達到字元串的復雜控制。
3. 對於剛接觸的人來說,比較晦澀難懂。
由於正則表達式主要應用對象是文本,因此它在各種文本編輯器場合都有應用,小到著名編輯器EditPlus,大到Microsoft Word、Visual Studio等大型編輯器,都可以使用正則表達式來處理文本內容。
正則表達式[3]由一些普通字元和一些元字元(metacharacters)組成。普通字元包括大小寫的字母和數字,而元字元則具有特殊的含義,我們下面會給予解釋。
在最簡單的情況下,一個正則表達式看上去就是一個普通的查找串。例如,正則表達式"testing"中沒有包含任何元字元,它可以匹配"testing"和"123testing"等字元串,但是不能匹配"Testing"。
[4]要想真正的用好正則表達式,正確的理解元字元是最重要的事情。下表列出了所有的元字元和對它們的一個簡短的描述。

元字元

描述

\

將下一個字元標記為一個特殊字元、或一個原義字元、或一個向後引用、或一個八進制轉義符。例如,「\n」匹配一個換行符。「\\n」匹配字元"n"。序列「\\」匹配「\」而「\(」則匹配「(」。

^

匹配輸入字元串的開始位置。如果設置了RegExp對象的Multiline屬性,^也匹配「\n」或「\r」之後的位置。

$

匹配輸入字元串的結束位置。如果設置了RegExp對象的Multiline屬性,$也匹配「\n」或「\r」之前的位置。

*

匹配前面的子表達式零次或多次。例如,zo*能匹配「z」以及「zoo」。*等價於{0,}。

+

匹配前面的子表達式一次或多次。例如,「zo+」能匹配「zo」以及「zoo」,但不能匹配「z」。+等價於{1,}。

?

匹配前面的子表達式零次或一次。例如,「do(es)?」可以匹配「does」或「does」中的「do」。?等價於{0,1}。

{n}

n是一個非負整數。匹配確定的n次。例如,「o{2}」不能匹配「Bob」中的「o」,但是能匹配「food」中的兩個o。

{n,}

n是一個非負整數。至少匹配n次。例如,「o{2,}」不能匹配「Bob」中的「o」,但能匹配「foooood」中的所有o。「o{1,}」等價於「o+」。「o{0,}」則等價於「o*」。

{n,m}

m和n均為非負整數,其中n<=m。最少匹配n次且最多匹配m次。例如,「o{1,3}」將匹配「fooooood」中的前三個o。「o{0,1}」等價於「o?」。請注意在逗號和兩個數之間不能有空格。

?

當該字元緊跟在任何一個其他限制符(*,+,?,{n},{n,},{n,m})後面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字元串,而默認的貪婪模式則盡可能多的匹配所搜索的字元串。例如,對於字元串「oooo」,「o?」將匹配單個「o」,而「o+」將匹配所有「o」。

.點

匹配除「\n」之外的任何單個字元。要匹配包括「\n」在內的任何字元,請使用像「[\s\S]」的模式。

(pattern)

匹配pattern並獲取這一匹配。所獲取的匹配可以從產生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中則使用$0…$9屬性。要匹配圓括弧字元,請使用「\(」或「\)」。

(?:pattern)

匹配pattern但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行存儲供以後使用。這在使用或字元「(|)」來組合一個模式的各個部分是很有用。例如「instr(?:y|ies)」就是一個比「instry|instries」更簡略的表達式。

(?=pattern)

正向肯定預查,在任何匹配pattern的字元串開始處匹配查找字元串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。例如,「Windows(?=95|98|NT|2000)」能匹配「Windows2000」中的「Windows」,但不能匹配「Windows3.1」中的「Windows」。預查不消耗字元,也就是說,在一個匹配發生後,在最後一次匹配之後立即開始下一次匹配的搜索,而不是從包含預查的字元之後開始。

(?!pattern)

正向否定預查,在任何不匹配pattern的字元串開始處匹配查找字元串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。例如「Windows(?!95|98|NT|2000)」能匹配「Windows3.1」中的「Windows」,但不能匹配「Windows2000」中的「Windows」。

(?<=pattern)

反向肯定預查,與正向肯定預查類似,只是方向相反。例如,「(?<=95|98|NT|2000)Windows」能匹配「2000Windows」中的「Windows」,但不能匹配「3.1Windows」中的「Windows」。

(?<!pattern)

反向否定預查,與正向否定預查類似,只是方向相反。例如「(?<!95|98|NT|2000)Windows」能匹配「3.1Windows」中的「Windows」,但不能匹配「2000Windows」中的「Windows」。

x|y

匹配x或y。例如,「z|food」能匹配「z」或「food」。「(z|f)ood」則匹配「zood」或「food」。

[xyz]

字元集合。匹配所包含的任意一個字元。例如,「[abc]」可以匹配「plain」中的「a」。

[^xyz]

負值字元集合。匹配未包含的任意字元。例如,「[^abc]」可以匹配「plain」中的「plin」。

[a-z]

字元范圍。匹配指定范圍內的任意字元。例如,「[a-z]」可以匹配「a」到「z」范圍內的任意小寫字母字元。
注意:只有連字元在字元組內部時,並且出兩個字元之間時,才能表示字元的范圍; 如果出字元組的開頭,則只能表示連字元本身.

[^a-z]

負值字元范圍。匹配任何不在指定范圍內的任意字元。例如,「[^a-z]」可以匹配任何不在「a」到「z」范圍內的任意字元。

\b

匹配一個單詞邊界,也就是指單詞和空格間的位置。例如,「er\b」可以匹配「never」中的「er」,但不能匹配「verb」中的「er」。

\B

匹配非單詞邊界。「er\B」能匹配「verb」中的「er」,但不能匹配「never」中的「er」。

\cx

匹配由x指明的控制字元。例如,\cM匹配一個Control-M或回車符。x的值必須為A-Z或a-z之一。否則,將c視為一個原義的「c」字元。

\d

匹配一個數字字元。等價於[0-9]。

\D

匹配一個非數字字元。等價於[^0-9]。

\f

匹配一個換頁符。等價於\x0c和\cL。

\n

匹配一個換行符。等價於\x0a和\cJ。

\r

匹配一個回車符。等價於\x0d和\cM。

\s

匹配任何空白字元,包括空格、製表符、換頁符等等。等價於[ \f\n\r\t\v]。

\S

匹配任何非空白字元。等價於[^ \f\n\r\t\v]。

\t

匹配一個製表符。等價於\x09和\cI。

\v

匹配一個垂直製表符。等價於\x0b和\cK。

\w

匹配包括下劃線的任何單詞字元。等價於「[A-Za-z0-9_]」。

\W

匹配任何非單詞字元。等價於「[^A-Za-z0-9_]」。

\xn

匹配n,其中n為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。例如,「\x41」匹配「A」。「\x041」則等價於「\x04&1」。正則表達式中可以使用ASCII編碼。

\num

匹配num,其中num是一個正整數。對所獲取的匹配的引用。例如,「(.)\1」匹配兩個連續的相同字元。

\n

標識一個八進制轉義值或一個向後引用。如果\n之前至少n個獲取的子表達式,則n為向後引用。否則,如果n為八進制數字(0-7),則n為一個八進制轉義值。

\nm

標識一個八進制轉義值或一個向後引用。如果\nm之前至少有nm個獲得子表達式,則nm為向後引用。如果\nm之前至少有n個獲取,則n為一個後跟文字m的向後引用。如果前面的條件都不滿足,若n和m均為八進制數字(0-7),則\nm將匹配八進制轉義值nm。

\nml

如果n為八進制數字(0-7),且m和l均為八進制數字(0-7),則匹配八進制轉義值nml。

\un

匹配n,其中n是一個用四個十六進制數字表示的Unicode字元。例如,\u00A9匹配版權符號(&;)。

\< \> 匹配詞(word)的開始(\<)和結束(\>)。例如正則表達式\<the\>能夠匹配字元串"for the wise"中的"the",但是不能匹配字元串"otherwise"中的"the"。注意:這個元字元不是所有的軟體都支持的。
\( \) 將 \( 和 \) 之間的表達式定義為「組」(group),並且將匹配這個表達式的字元保存到一個臨時區域(一個正則表達式中最多可以保存9個),它們可以用 \1 到\9 的符號來引用。
| 將兩個匹配條件進行邏輯「或」(Or)運算。例如正則表達式(him|her) 匹配"it belongs to him"和"it belongs to her",但是不能匹配"it belongs to them."。注意:這個元字元不是所有的軟體都支持的。
+ 匹配1或多個正好在它之前的那個字元。例如正則表達式9+匹配9、99、999等。注意:這個元字元不是所有的軟體都支持的。
? 匹配0或1個正好在它之前的那個字元。注意:這個元字元不是所有的軟體都支持的。
{i} {i,j} 匹配指定數目的字元,這些字元是在它之前的表達式定義的。例如正則表達式A[0-9]{3} 能夠匹配字元"A"後面跟著正好3個數字字元的串,例如A123、A348等,但是不匹配A1234。而正則表達式[0-9]{4,6} 匹配連續的任意4個、5個或者6個數字

熱點內容
lob存儲器 發布:2025-01-18 16:49:36 瀏覽:144
c語言統計字元串出現次數 發布:2025-01-18 16:47:56 瀏覽:929
androidpcmamr 發布:2025-01-18 16:45:02 瀏覽:774
南昊成績查詢的密碼是多少 發布:2025-01-18 16:44:53 瀏覽:88
雷克薩斯nx哪個配置最保值 發布:2025-01-18 16:07:41 瀏覽:462
怎麼改加密密碼 發布:2025-01-18 16:06:48 瀏覽:125
通過域名訪問內網 發布:2025-01-18 16:01:39 瀏覽:275
md5加密後的密碼是什麼意思 發布:2025-01-18 15:50:16 瀏覽:193
如何qq空間訪問許可權 發布:2025-01-18 15:49:30 瀏覽:532
matlab遺傳演算法約束 發布:2025-01-18 15:31:33 瀏覽:910