php正則英文
❶ 如何用php 正則匹配出含有HTML標簽的字元串中的英文單詞
通過仔細閱讀問題描述,樣本採用 html格式編寫,其內容為中英文互譯,如問題所要求的:「正文中的,英文單詞都匹配出來」。
提供一下思路:
建議可以將問題簡化一下,即只取正文中的英文部分。
通過觀察如上提供的樣本中,大部分的英文部分都以標簽<div class="set_en">...</div>(其中有一個 div標簽沒有配對) ,則步驟如下:
1、先編寫正則取出標簽中的內容:
❷ 史上最全的PHP正則表達式
一、校驗數字的表達式
1 數字:
^[0-9]*$
2 n位的數字:
^\d{n}$
3 至少n位的數字:
^\d{n,}$
4 m-n位的數字:
^\d{m,n}$
5 零和非零開頭的數字:
^(0|[1-9][0-9]*)$
6 非零開頭的最多帶兩位小數的數字:
^([1-9][0-9]*)+(.[0-9]{1,2})?$
7 帶1-2位小數的正數或負數:
^(\-)?\d+(\.\d{1,2})?$
8 正數、負數、和小數:
^(\-|\+)?\d+(\.\d+)?$
9 有兩位小數的正實數:
^[0-9]+(.[0-9]{2})?$
10 有1~3位小數的正實數:
^[0-9]+(.[0-9]{1,3})?$
11 非零的正整數:
^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$
12 非零的負整數:
^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$
13 非負整數:
^\d+$ 或 ^[1-9]\d*|0$
14 非正整數:
^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
15 非負浮點數:
^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
16 非正浮點數:
^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
17 正浮點數:
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
18 負浮點數:
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19 浮點數:
^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
二、校驗字元的表達式
1 漢字:
^[\u4e00-\u9fa5]{0,}$
2 英文和數字:
^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
3 長度為3-20的所有字元:
^.{3,20}$
4 由26個英文字母組成的字元串:
^[A-Za-z]+$
5 由26個大寫英文字母組成的字元串:
^[A-Z]+$
6 由26個小寫英文字母組成的字元串:
^[a-z]+$
7 由數字和26個英文字母組成的字元串:
^[A-Za-z0-9]+$
8 由數字、26個英文字母或者下劃線組成的字元串:
^\w+$ 或 ^\w{3,20}$
9 中文、英文、數字包括下劃線:
^[\u4E00-\u9FA5A-Za-z0-9_]+$
10 中文、英文、數字但不包括下劃線等符號:
^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
11 可以輸入含有^%&',;=?$\"等字元:
[^%&',;=?$\x22]+
12 禁止輸入含有~的字元:
[^~\x22]+
三、特殊需求表達式
1、 Email地址:
^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
2 、域名:
[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
3 、InternetURL:
[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
4 、手機號碼:
^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
5 、電話號碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):
^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
6 國內電話號碼(0511-4405222、021-87888822):
\d{3}-\d{8}|\d{4}-\d{7}
7 、身份證號:
15或18位身份證:
^\d{15}|\d{18}$
15位身份證:
^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$
18位身份證:
^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{4}$
8、 短身份證號碼(數字、字母x結尾):
^([0-9]){7,18}(x|X)?$
或
^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
9 、帳號是否合法(字母開頭,允許5-16位元組,允許字母數字下劃線):
^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10 、密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):
^[a-zA-Z]\w{5,17}$
11 、強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字元,長度在8-10之間):
^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
12、 日期格式:
^\d{4}-\d{1,2}-\d{1,2}
13、 一年的12個月(01~09和1~12):
^(0?[1-9]|1[0-2])$
14 、一個月的31天(01~09和1~31):
^((0?[1-9])|((1|2)[0-9])|30|31)$
15 、錢的輸入格式:
16 、1.有四種錢的表示形式我們可以接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000":
^[1-9][0-9]*$
17、 2.這表示任意一個不以0開頭的數字,但是,這也意味著一個字元"0"不通過,所以我們採用下面的形式:
^(0|[1-9][0-9]*)$
18 、3.一個0或者一個不以0開頭的數字.我們還可以允許開頭有一個負號:
^(0|-?[1-9][0-9]*)$
19 、4.這表示一個0或者一個可能為負的開頭不為0的數字.讓用戶以0開頭好了.把負號的也去掉,因為錢總不能是負的吧.下面我們要加的是說明可能的小數部分:
^[0-9]+(.[0-9]+)?$
20 、5.必須說明的是,小數點後面至少應該有1位數,所以"10."是不通過的,但是 "10" 和 "10.2" 是通過的:
^[0-9]+(.[0-9]{2})?$
21、 6.這樣我們規定小數點後面必須有兩位,如果你認為太苛刻了,可以這樣:
^[0-9]+(.[0-9]{1,2})?$
22、 7.這樣就允許用戶只寫一位小數.下面我們該考慮數字中的逗號了,我們可以這樣:
^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
23 、8.1到3個數字,後面跟著任意個 逗號+3個數字,逗號成為可選,而不是必須:
^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
24 、備註:這就是最終結果了,別忘了"+"可以用"*"替代如果你覺得空字元串也可以接受的話(奇怪,為什麼?)最後,別忘了在用函數時去掉去掉那個反斜杠,一般的錯誤都在這里
25 、xml文件:
^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
26 、中文字元的正則表達式:
[\u4e00-\u9fa5]
27 、雙位元組字元:
[^\x00-\xff]
(包括漢字在內,可以用來計算字元串的長度(一個雙位元組字元長度計2,ASCII字元計1))
28 、空白行的正則表達式:\n\s*\r (可以用來刪除空白行)
29 、HTML標記的正則表達式:
<(\S*?)[^>]*>.*?|<.*? /> (網上流傳的版本太糟糕,上面這個也僅僅能部分,對於復雜的嵌套標記依舊無能為力)
30 、首尾空白字元的正則表達式:^\s*|\s*$或(^\s*)|(\s*$) (可以用來刪除行首行尾的空白字元(包括空格、製表符、換頁符等等),非常有用的表達式)
31 、騰訊QQ號:[1-9][0-9]{4,} (騰訊QQ號從10000開始)
32 、中國郵政編碼:[1-9]\d{5}(?!\d) (中國郵政編碼為6位數字)
33、 IP地址:\d+\.\d+\.\d+\.\d+ (提取IP地址時有用)
❸ php正則表達式把西文雙引號替換成中文雙引號
我來解釋下2樓的代碼, preg_replace的第一個參數的正則,第二個參數是替換結果,第三個參數是要替換的字元串。
第一個參數'/"([^"]*)"/'的意思是匹配成對出現的雙引號內容,()代表引用,[^"]*代表引號內的內容,也就是一個不包含"的任意長度的字元串。
第二個參數'「${1}」'中的${1}使用了第一個參數中的第一個引用,也就是雙引號內的內容,所以第二個參數的意思就是將第一個參數的正則匹配到的英文雙引號內的內容放到了中文雙引號中。
解釋完畢。
❹ 請教php正則表達式,中英文,數字和短橫線
$str="fddfdf-123";
preg_match("/^[^_|\\d][\\x4E00-\\x9FA5\\xF900-\\xFA2D|_|A-Z-a-z|\\d]{5,10}$/", $str, $matches);
print_r($matches);
再有問題請hi我。
❺ 求php正則表達式 要求匹配 純英文字元串#純數字(位數不限), 謝謝
正則為:/^[a-z0-9#]*$/
檢測代碼如下:
$str='####1414adsad';
if(preg_match("/^[a-z0-9#]*$/",$str))
{
echo"驗證成功";
}
else
{
echo"驗證失敗";
}
3. 可以改變$str的值來檢測,該正則是否正確
❻ 超常用的PHP正則表達式收集整理
以下就是對超常用的PHP正則表達式進行的收集整理,為了方便大家更快更好的掌握php正則表達式。
一、表單驗證匹配
驗證賬號,字母開頭,允許
5-16
位元組,允許字母數字下劃線:^[a-zA-Z][a-zA-Z0-9_]{4,15}$
驗證賬號,不能為空,不能有空格,只能是英文字母:^\S+[a-z
A-Z]$
驗證賬號,不能有空格,不能非數字:^\d+$
驗證用戶密碼,以字母開頭,長度在
6-18
之間:^[a-zA-Z]\w{5,17}$
驗證是否含有
^%&',;=?$\
等字元:[^%&',;=?$\x22]+
匹配Email地址:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配騰訊QQ號:[1-9][0-9]{4,}
匹配日期,只能是
2004-10-22
格式:^\d{4}\-\d{1,2}-\d{1,2}$
匹配國內電話號碼:^\d{3}-\d{8}|\d{4}-\d{7,8}$------------評註:匹配形式如010-12345678
或0571-12345678
或
0831-1234567
匹配中國郵政編碼:^[1-9]\d{5}(?!\d)$
匹配身份證:\d{14}(\d{4}|(\d{3}[xX])|\d{1})------------評註:中國的身份證為15
位或18
位
不能為空且二十位元組以上:^[\s|\S]{20,}$
二、字元匹配
匹配由
26
個英文字母組成的字元串:^[A-Za-z]+$
匹配由
26
個大寫英文字母組成的字元串:^[A-Z]+$
匹配由
26
個小寫英文字母組成的字元串:^[a-z]+$
匹配由數字和
26
個英文字母組成的字元串:^[A-Za-z0-9]+$
匹配由數字、26個英文字母或者下劃線組成的字元串:^\w+$
匹配空行:\n[\s|
]*\r
匹配任何內容:[\s\S]*
匹配中文字元:[\x80-\xff]+
或者
[\xa1-\xff]+
只能輸入漢字:^[\x80-\xff],{0,}$
匹配雙位元組字元(包括漢字在內):[^\x00-\xff]
三、匹配數字
只能輸入數字:^[0-9]*$
只能輸入n位的數字:^\d{n}$
只能輸入至少n位數字:^\d{n,}$
只能輸入m-n位的數字:^\d{m,n}$
匹配正整數:^[1-9]\d*$
匹配負整數:^-[1-9]\d*$
匹配整數:^-?[1-9]\d*$
匹配非負整數(正整數
+
0):^[1-9]\d*|0$
匹配非正整數(負整數
+
0):^-[1-9]\d*|0$
匹配正浮點數:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$
匹配負浮點數:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$
匹配浮點數:^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
匹配非負浮點數(正浮點數
+
0):^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
匹配非正浮點數(負浮點數
+
0):^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
四、其他
匹配HTML標記的正則表達式(無法匹配嵌套標簽):<(\S*?)[^>]*>.*?</\1>|<.*?
/>
匹配網址
URL
:[a-zA-z]+://[^\s]*
匹配
IP
地址:((25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3}(25[0-5]|2[0-4]\d|[01]?\d\d?)
匹配完整域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+\.?
提示
上述正則表達式通常都加了
^
與
$
來限定字元的起始和結束,如果需要匹配的內容包括在字元串當中,可能需要考慮去掉
^
和
$
限定符。
以上正則表達式僅供參考,使用時請檢驗後再使用,希望通過這些超常用的PHP正則表達式
❼ PHP中正則表達式匹配字母
function test($str){
if (<a href="https://www..com/s?wd=preg_match&tn=44039180_cpr&fenlei=-m16sPhu9rH01P1n3PWN--bIi4WUvYETgN-" target="_blank" class="-highlight">preg_match</a>("/^[\x81-\xfe][\x40-\xfe]?/",$str)) {
return "首字母有中文";
}
return "首字母沒中文";
}
echo test("中1231213");//首字母有中文
echo test("123中");//首字母沒中文
❽ php 正則表達式 只能包含字母和數字
[\u4e00-\u9fa5]
//匹配中文字元
^[1-9]\d*$
//匹配正整數
^[a-za-z]+$
//匹配由26個英文字母組成的字元串
^[a-z]+$
//匹配由26個英文字母的大寫組成的字元串
^[a-z]+$
//匹配由26個英文字母的小寫組成的字元串
^[a-za-z0-9]+$
//匹配由數字和26個英文字母組成的字元串
❾ PHP正則表達,漢字大小寫字母數字下劃線以及@符號
郵箱的正則表達式為:/^[_a-z0-9-]+(.[_a-z0-9-]+)*@[a-z0-9-]+(.[a-z0-9-]+)*$/,其他的一樓已經回答得很完備了
❿ php 匹配中英文的正則表達式。。。。謝謝啦~~~
<?php
header('Content-type:text/html;charset=utf-8');
$str = "php編程ddd漢字%#^%字元";
$pa = '/[a-zA-Z\x{4e00}-\x{9fa5}]/u';
preg_match_all($pa,$str,$arr);
echo '<pre>';
print_r($arr);
echo '</pre>';
?>
運行結果:
Array
(
[0] => Array
(
[0] => p
[1] => h
[2] => p
[3] => 編
[4] => 程
[5] => d
[6] => d
[7] => d
[8] => 漢
[9] => 字
[10] => 字
[11] => 符
)
)