正則java

發布時間: 2022-01-11 22:51:05

1. java中正則表達式判斷

查查正則所代表的含義不就自己能寫了嗎？
非數字 \D
附：

\d 等於 [0-9] 數字
\D 等於 [^0-9] 非數字
\s 等於 [ \t\n\x0B\f\r] 空白字元
\S 等於 [^ \t\n\x0B\f\r] 非空白字元
\w 等於 [a-zA-Z_0-9] 數字或是英文字
\W 等於 [^a-zA-Z_0-9] 非數字與英文字

^ 表示每行的開頭
$ 表示每行的結尾
－－－－－－－－－－－－－－－－－－－－－－
一樓的是對的。String.matches返回boolean值。
if (name.matches("^\\w+$")) {
...
}
注意轉義字元。

2. JAVA正則表達式

http://blog.pfan.cn/iamben250/34352.html這是我的blog上面的詳細介紹。配中文字元的正則表達式： [\u4e00-\u9fa5]

匹配雙位元組字元(包括漢字在內)：[^\x00-\xff]

應用：計算字元串的長度（一個雙位元組字元長度計2，ASCII字元計1）

String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}

匹配空行的正則表達式：\n[\s| ]*\r

匹配HTML標記的正則表達式：/<(.*)>.*<\/\1>|<(.*) \/>/

匹配首尾空格的正則表達式：(^\s*)|(\s*$)

應用：javascript中沒有像vbscript那樣的trim函數，我們就可以利用這個表達式來實現，如下：

String.prototype.trim = function()
{
return this.replace(/(^\s*)|(\s*$)/g, "");
}

利用正則表達式分解和轉換IP地址：

下面是利用正則表達式匹配IP地址，並將IP地址轉換成對應數值的Javascript程序：

function IP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正則表達式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}

不過上面的程序如果不用正則表達式，而直接用split函數來分解可能更簡單，程序如下：

var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是："+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

匹配Email地址的正則表達式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配網址URL的正則表達式：http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?

利用正則表達式去除字串中重復的字元的演算法程序：[註：此程序不正確，原因見本貼回復]

var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //結果為：abcefgi

我原來在CSDN上發貼尋求一個表達式來實現去除重復字元的方法，最終沒有找到，這是我能想到的最簡單的實現方法。思路是使用後向引用取出包括重復的字元，再以重復的字元建立第二個表達式，取到不重復的字元，兩者串連。這個方法對於字元順序有要求的字元串可能不適用。

得用正則表達式從URL地址中提取文件名的javascript程序，如下結果為page1

s=" http://www.9499.net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)

利用正則表達式限制網頁表單里的文本框輸入內容：

用正則表達式限制只能輸入中文：onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"

用正則表達式限制只能輸入全形字元： onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"

用正則表達式限制只能輸入數字：onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

用正則表達式限制只能輸入數字和英文：onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" 出處：藍色理想
前一段時間寫了2段EmEditor的宏，用來統計代碼行數和簡單的規約檢查，稍微整理一下，
下面是從EmEditor的Q&A的提取的實例：雙引號包含的字元串
strings surrounded by double-quotation marks
「.*?」 [ ]包含的字元串
strings surrounded by [ ]
\[[^\[]*?\] 變數名
variable names
[a-zA-Z_][a-zA-Z_0-9]* IP 地址
IP addresses
([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3}) 網頁地址
URL
(\S+)://([^:/]+)(:(\d+))?(/[^#\s]*)(#(\S+))? 各行Tab以後的文字列
lines followed by a tab
\t.*$ 平仮名ひらがな
Hiragana
[\x{3041}-\x{309e}] 全形片仮名全形カタカナ
Full-width Katakana
[\x{309b}-\x{309c}\x{30a1}-\x{30fe}] 半形仮名半形カナ
Half-width Kana
[\x{ff61}-\x{ff9f}] 中日韓漢字
CJK ideographs
[\x{3400}-\x{9fff}\x{f900}-\x{fa2d}] 中日韓漢字元號
CJK ideograph marks
[\x{3000}-\x{3037}] 韓國字元
Hangul
[\x{1100}-\x{11f9}\x{3131}-\x{318e}\x{ac00}-\x{d7a3}] 行頭插入 //
Insert // at start of lines
Find: ^
Replace with: // 刪除行頭 //
Remove // at end of lines
Find: ^//
Replace: 刪除行後的空白文字（包含空格和製表位 Space+Tab）
Remove trailing whitespaces
Find: \s+?$
Replace with: 將(abc)替換為[abc]
Replace (abc) with [abc]
Find: $(.*?)$
Replace: \[\1\] 將<H3 …>替換為<H4 …>
Replace <H3 …> with <H4 …>
Find: <H3(.*?)>
Replace: <H4\1> 將9/13/2003替換為2003年9月13日
Replace 9/13/2003 with 2003.9.13
Find: ([0-9]{1,2})/([0-9]{1,2})/([0-9]{2,4})
Replace: \3年\1月\2日將字母a-z替換為大寫字母
Uppercase characters from a to z
Find: [a-z]
Replace: \U\0 首字母大寫
Capitalize all words
Find: ([a-zA-Z])([a-zA-Z]*)
Replace: \U\1\L\2

3. java 正則表達式是什麼

不同情況下的正則表達式：

匹配首尾空格的正則表達式：(^s*)|(s*$)。
匹配html標簽的正則表達式：<(.*)>(.*)</(.*)>|<(.*)/>。
配空行的正則表達式： [s| ]* 。
整數或者小數：^[0-9]+.{0,1}[0-9]{0,2}$。
只能輸入數字："^[0-9]*$"。
只能輸入n位的數字："^d{n}$"。
只能輸入至少n位的數字："^d{n,}$"。
只能輸入m~n位的數字：。"^d{m,n}$"
只能輸入零和非零開頭的數字："^(0|[1-9][0-9]*)$"。
只能輸入有兩位小數的正實數："^[0-9]+(.[0-9]{2})?$"。
只能輸入有1~3位小數的正實數："^[0-9]+(.[0-9]{1,3})?$"。
只能輸入非零的正整數："^+?[1-9][0-9]*$"。
只能輸入非零的負整數："^-[1-9][]0-9"*$。
只能輸入長度為3的字元："^.{3}$"。
只能輸入由26個英文字母組成的字元串："^[A-Za-z]+$"。
只能輸入由26個大寫英文字母組成的字元串："^[A-Z]+$"。
只能輸入由26個小寫英文字母組成的字元串："^[a-z]+$"。
只能輸入由數字和26個英文字母組成的字元串："^[A-Za-z0-9]+$"。
只能輸入由數字、26個英文字母或者下劃線組成的字元串："^w+$"。
驗證用戶密碼："^[a-zA-Z]w{5,17}$"正確格式為：以字母開頭，長度在6~18之間，只能包含字元、數字和下劃線。
驗證是否含有^%&',;=?$"等字元："[^%&',;=?$x22]+"。
只能輸入漢字："^[u4e00-u9fa5]{0,}$"。
驗證Email地址："^w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$"。
驗證一年的12個月："^(0?[1-9]|1[0-2])$"正確格式為："01"～"09"和"1"～"12"。
驗證一個月的31天："^((0?[1-9])|((1|2)[0-9])|30|31)$"正確格式為；"01"～"09"和"1"～"31"。
匹配中文字元的正則表達式： [u4e00-u9fa5]。
匹配雙位元組字元(包括漢字在內)：[^x00-xff]。
應用：計算字元串的長度（一個雙位元組字元長度計2，ASCII字元計1）String.prototype.len=function(){returnthis.replace(/[^x00-xff]/g,"aa").length;}。

4. java 正則表達式 ^java 是什麼意思

給你一個正則表達式各種字元解釋，以後，就萬事不怕了。

字元描述
\ 將下一個字元標記為一個特殊字元、或一個原義字元、或一個向後引用、或一個八進制轉義符。例如，'n' 匹配字元 "n"。'\n' 匹配一個換行符。序列 '\\' 匹配 "\" 而 "\(" 則匹配 "("。
^ 匹配輸入字元串的開始位置。如果設置了 RegExp 對象的 Multiline 屬性，^ 也匹配 '\n' 或 '\r' 之後的位置。
$ 匹配輸入字元串的結束位置。如果設置了RegExp 對象的 Multiline 屬性，$ 也匹配 '\n' 或 '\r' 之前的位置。
* 匹配前面的子表達式零次或多次。例如，zo* 能匹配 "z" 以及 "zoo"。* 等價於{0,}。
+ 匹配前面的子表達式一次或多次。例如，'zo+' 能匹配 "zo" 以及 "zoo"，但不能匹配 "z"。+ 等價於 {1,}。
? 匹配前面的子表達式零次或一次。例如，"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價於 {0,1}。
{n} n 是一個非負整數。匹配確定的 n 次。例如，'o{2}' 不能匹配 "Bob" 中的 'o'，但是能匹配 "food" 中的兩個 o。
{n,} n 是一個非負整數。至少匹配n 次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的所有 o。'o{1,}' 等價於 'o+'。'o{0,}' 則等價於 'o*'。
{n,m} m 和 n 均為非負整數，其中n <= m。最少匹配 n 次且最多匹配 m 次。例如，"o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。
? 當該字元緊跟在任何一個其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 後面時，匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜索的字元串，而默認的貪婪模式則盡可能多的匹配所搜索的字元串。例如，對於字元串 "oooo"，'o+?' 將匹配單個 "o"，而 'o+' 將匹配所有 'o'。
. 匹配除 "\n" 之外的任何單個字元。要匹配包括 '\n' 在內的任何字元，請使用象 '[.\n]' 的模式。
(pattern) 匹配 pattern 並獲取這一匹配。所獲取的匹配可以從產生的 Matches 集合得到，在VBScript 中使用 SubMatches 集合，在JScript 中則使用 $0…$9 屬性。要匹配圓括弧字元，請使用 '$' 或 '$'。
(?:pattern) 匹配 pattern 但不獲取匹配結果，也就是說這是一個非獲取匹配，不進行存儲供以後使用。這在使用 "或" 字元 (|) 來組合一個模式的各個部分是很有用。例如， 'instr(?:y|ies) 就是一個比 'instry|instries' 更簡略的表達式。
(?=pattern) 正向預查，在任何匹配 pattern 的字元串開始處匹配查找字元串。這是一個非獲取匹配，也就是說，該匹配不需要獲取供以後使用。例如，'Windows (?=95|98|NT|2000)' 能匹配 "Windows 2000" 中的 "Windows" ，但不能匹配 "Windows 3.1" 中的 "Windows"。預查不消耗字元，也就是說，在一個匹配發生後，在最後一次匹配之後立即開始下一次匹配的搜索，而不是從包含預查的字元之後開始。
(?!pattern) 負向預查，在任何不匹配 pattern 的字元串開始處匹配查找字元串。這是一個非獲取匹配，也就是說，該匹配不需要獲取供以後使用。例如'Windows (?!95|98|NT|2000)' 能匹配 "Windows 3.1" 中的 "Windows"，但不能匹配 "Windows 2000" 中的 "Windows"。預查不消耗字元，也就是說，在一個匹配發生後，在最後一次匹配之後立即開始下一次匹配的搜索，而不是從包含預查的字元之後開始
x|y 匹配 x 或 y。例如，'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 則匹配 "zood" 或 "food"。
[xyz] 字元集合。匹配所包含的任意一個字元。例如， '[abc]' 可以匹配 "plain" 中的 'a'。
[^xyz] 負值字元集合。匹配未包含的任意字元。例如， '[^abc]' 可以匹配 "plain" 中的'p'。
[a-z] 字元范圍。匹配指定范圍內的任意字元。例如，'[a-z]' 可以匹配 'a' 到 'z' 范圍內的任意小寫字母字元。
[^a-z] 負值字元范圍。匹配任何不在指定范圍內的任意字元。例如，'[^a-z]' 可以匹配任何不在 'a' 到 'z' 范圍內的任意字元。
\b 匹配一個單詞邊界，也就是指單詞和空格間的位置。例如， 'er\b' 可以匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er'。
\B 匹配非單詞邊界。'er\B' 能匹配 "verb" 中的 'er'，但不能匹配 "never" 中的 'er'。
\cx 匹配由 x 指明的控制字元。例如， \cM 匹配一個 Control-M 或回車符。x 的值必須為 A-Z 或 a-z 之一。否則，將 c 視為一個原義的 'c' 字元。
\d 匹配一個數字字元。等價於 [0-9]。
\D 匹配一個非數字字元。等價於 [^0-9]。
\f 匹配一個換頁符。等價於 \x0c 和 \cL。
\n 匹配一個換行符。等價於 \x0a 和 \cJ。
\r 匹配一個回車符。等價於 \x0d 和 \cM。
\s 匹配任何空白字元，包括空格、製表符、換頁符等等。等價於 [ \f\n\r\t\v]。
\S 匹配任何非空白字元。等價於 [^ \f\n\r\t\v]。
\t 匹配一個製表符。等價於 \x09 和 \cI。
\v 匹配一個垂直製表符。等價於 \x0b 和 \cK。
\w 匹配包括下劃線的任何單詞字元。等價於'[A-Za-z0-9_]'。
\W 匹配任何非單詞字元。等價於 '[^A-Za-z0-9_]'。
\xn 匹配 n，其中 n 為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。例如，'\x41' 匹配 "A"。'\x041' 則等價於 '\x04' & "1"。正則表達式中可以使用 ASCII 編碼。.
\num 匹配 num，其中 num 是一個正整數。對所獲取的匹配的引用。例如，'(.)\1' 匹配兩個連續的相同字元。
\n 標識一個八進制轉義值或一個向後引用。如果 \n 之前至少 n 個獲取的子表達式，則 n 為向後引用。否則，如果 n 為八進制數字 (0-7)，則 n 為一個八進制轉義值。
\nm 標識一個八進制轉義值或一個向後引用。如果 \nm 之前至少有 nm 個獲得子表達式，則 nm 為向後引用。如果 \nm 之前至少有 n 個獲取，則 n 為一個後跟文字 m 的向後引用。如果前面的條件都不滿足，若 n 和 m 均為八進制數字 (0-7)，則 \nm 將匹配八進制轉義值 nm。
\nml 如果 n 為八進制數字 (0-3)，且 m 和 l 均為八進制數字 (0-7)，則匹配八進制轉義值 nml。
\un 匹配 n，其中 n 是一個用四個十六進制數字表示的 Unicode 字元。例如， \u00A9 匹配版權符號 (?)。

5. java正則表達式

你可以使用零寬斷言來實現這個拆分。

比如題目中的要求可以使用正則：(?<!\),

你也可以使用JAVA正則表達式在線測試在線測試java正則表達式。

題目的測試結果如下：

6. JAVA中正則表達式

|是或者號，第一個表達式里最後有個|，那麼它後面的內容（空）也是表達式的一部分了

replaceAll("","1")的結果就是每個空串都變成一個1

importjava.util.*;
importjava.lang.*;
importjava.io.*;
/*Nameoftheclasshastobe"Main"onlyiftheclassispublic.*/
classIdeone
{
publicstaticvoidmain(String[]args)throwsjava.lang.Exception
{
//yourcodegoeshere
Strings="abcdefghijk";
Strings1=s.replaceAll("","1");
System.out.println(s1);
}
}

結果是：

Success time: 0.04 memory: 4386816 signal:

1a1b1c1d1e1f1g1h1i1j1k1

也即是說，每個字元前面都會有一個1

7. 正則表達式 java

1、java中""（斜杠）不能單獨出現，必須以"\"(雙斜杠)的形式使用。

2、對於正則中有特殊含義的字元需要轉義後才能按照原始的含義使用（java中在其前添加"\")

3、對於字元串中的雙斜杠（不作為正則表達式的）在匹配時需要按照雙斜杠來匹配。

4、實現代碼如下：

String string = "[N]C:\Program Files";
String reg = "^\s*\[[NTS]\][A-Z]:\\([a-zA-z]+\W?)+$";

System.out.println (string.matches (reg));

8. java正則表達式匹配

java里的正則表達式默認只匹配一行
若要支持匹配換行符，在建Pattern時使用兩個參數的那個方法，加上參數Pattern.DOTALL
Pattern p = Pattern.compile("\\d+.{1,2}\\d{2}:\\d{2};\\d{2},\\d{3}",Pattern.DOTALL);

9. JAVA 正則

String str[]=s.split("(?<=^|[+*/-])[+-]?[^+*/-]+");

10. java 正則表達式怎麼用啊

建議自己查J2SE 的 API java.util.regex Pattern
×××××××××××××××××××××××××××××××××××××××××××××
我給你貼出來
×××××××××××××××××××××××××××××××××××××××××××××

public final class Patternextends Objectimplements Serializable正則表達式的編譯表示形式。

指定為字元串的正則表達式必須首先被編譯為此類的實例。然後，可將得到的模式用於創建 Matcher 對象，依照正則表達式，該對象可以與任意字元序列匹配。執行匹配所涉及的所有狀態都駐留在匹配器中，所以多個匹配器可以共享同一模式。

因此，典型的調用順序是

Pattern p = Pattern.compile("a*b");
Matcher m = p.matcher("aaaaab");
boolean b = m.matches();在僅使用一次正則表達式時，可以方便地通過此類定義 matches 方法。此方法編譯表達式並在單個調用中將輸入序列與其匹配。語句

boolean b = Pattern.matches("a*b", "aaaaab");等效於上面的三個語句，盡管對於重復的匹配而言它效率不高，因為它不允許重用已編譯的模式。
此類的實例是不可變的，可供多個並發線程安全使用。Matcher 類的實例用於此目的則不安全。

正則表達式的構造摘要
構造匹配

字元
x 字元 x
\\ 反斜線字元
\0n 帶有八進制值 0 的字元 n (0 <= n <= 7)
\0nn 帶有八進制值 0 的字元 nn (0 <= n <= 7)
\0mnn 帶有八進制值 0 的字元 mnn（0 <= m <= 3、0 <= n <= 7）
\xhh 帶有十六進制值 0x 的字元 hh
\uhhhh 帶有十六進制值 0x 的字元 hhhh
\t 製表符 ('\u0009')
\n 新行（換行）符 ('\u000A')
\r 回車符 ('\u000D')
\f 換頁符 ('\u000C')
\a 報警 (bell) 符 ('\u0007')
\e 轉義符 ('\u001B')
\cx 對應於 x 的控制符

字元類
[abc] a、b 或 c（簡單類）
[^abc] 任何字元，除了 a、b 或 c（否定）
[a-zA-Z] a 到 z 或 A 到 Z，兩頭的字母包括在內（范圍）
[a-d[m-p]] a 到 d 或 m 到 p：[a-dm-p]（並集）
[a-z&&[def]] d、e 或 f（交集）
[a-z&&[^bc]] a 到 z，除了 b 和 c：[ad-z]（減去）
[a-z&&[^m-p]] a 到 z，而非 m 到 p：[a-lq-z]（減去）

預定義字元類
. 任何字元（與行結束符可能匹配也可能不匹配）
\d 數字：[0-9]
\D 非數字： [^0-9]
\s 空白字元：[ \t\n\x0B\f\r]
\S 非空白字元：[^\s]
\w 單詞字元：[a-zA-Z_0-9]
\W 非單詞字元：[^\w]

POSIX 字元類（僅 US-ASCII）
\p{Lower} 小寫字母字元：[a-z]
\p{Upper} 大寫字母字元：[A-Z]
\p{ASCII} 所有 ASCII：[\x00-\x7F]
\p{Alpha} 字母字元：[\p{Lower}\p{Upper}]
\p{Digit} 十進制數字：[0-9]
\p{Alnum} 字母數字字元：[\p{Alpha}\p{Digit}]
\p{Punct} 標點符號：!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
\p{Graph} 可見字元：[\p{Alnum}\p{Punct}]
\p{Print} 可列印字元：[\p{Graph}\x20]
\p{Blank} 空格或製表符：[ \t]
\p{Cntrl} 控制字元：[\x00-\x1F\x7F]
\p{XDigit} 十六進制數字：[0-9a-fA-F]
\p{Space} 空白字元：[ \t\n\x0B\f\r]

java.lang.Character 類（簡單的 java 字元類型）
\p{javaLowerCase} 等效於 java.lang.Character.isLowerCase()
\p{javaUpperCase} 等效於 java.lang.Character.isUpperCase()
\p{javaWhitespace} 等效於 java.lang.Character.isWhitespace()
\p{javaMirrored} 等效於 java.lang.Character.isMirrored()

Unicode 塊和類別的類
\p{InGreek} Greek 塊（簡單塊）中的字元
\p{Lu} 大寫字母（簡單類別）
\p{Sc} 貨幣符號
\P{InGreek} 所有字元，Greek 塊中的除外（否定）
[\p{L}&&[^\p{Lu}]] 所有字母，大寫字母除外（減去）

邊界匹配器
^ 行的開頭
$ 行的結尾
\b 單詞邊界
\B 非單詞邊界
\A 輸入的開頭
\G 上一個匹配的結尾
\Z 輸入的結尾，僅用於最後的結束符（如果有的話）
\z 輸入的結尾

Greedy 數量詞
X? X，一次或一次也沒有
X* X，零次或多次
X+ X，一次或多次
X{n} X，恰好 n 次
X{n,} X，至少 n 次
X{n,m} X，至少 n 次，但是不超過 m 次

Reluctant 數量詞
X?? X，一次或一次也沒有
X*? X，零次或多次
X+? X，一次或多次
X{n}? X，恰好 n 次
X{n,}? X，至少 n 次
X{n,m}? X，至少 n 次，但是不超過 m 次

Possessive 數量詞
X?+ X，一次或一次也沒有
X*+ X，零次或多次
X++ X，一次或多次
X{n}+ X，恰好 n 次
X{n,}+ X，至少 n 次
X{n,m}+ X，至少 n 次，但是不超過 m 次

Logical 運算符
XY X 後跟 Y
X|Y X 或 Y
(X) X，作為捕獲組

Back 引用
\n 任何匹配的 nth 捕獲組

引用
\ Nothing，但是引用以下字元
\Q Nothing，但是引用所有字元，直到 \E
\E Nothing，但是結束從 \Q 開始的引用

特殊構造（非捕獲）
(?:X) X，作為非捕獲組
(?idmsux-idmsux) Nothing，但是將匹配標志由 on 轉為 off
(?idmsux-idmsux:X) X，作為帶有給定標志 on - off 的非捕獲組
(?=X) X，通過零寬度的正 lookahead
(?!X) X，通過零寬度的負 lookahead
(?<=X) X，通過零寬度的正 lookbehind
(?<!X) X，通過零寬度的負 lookbehind
(?>X) X，作為獨立的非捕獲組

--------------------------------------------------------------------------------

反斜線、轉義和引用
反斜線字元 ('\') 用於引用轉義構造，如上表所定義的，同時還用於引用其他將被解釋為非轉義構造的字元。因此，表達式 \\ 與單個反斜線匹配，而 \{ 與左括弧匹配。

在不表示轉義構造的任何字母字元前使用反斜線都是錯誤的；它們是為將來擴展正則表達式語言保留的。可以在非字母字元前使用反斜線，不管該字元是否非轉義構造的一部分。

根據 Java Language Specification 的要求，Java 源代碼的字元串中的反斜線被解釋為 Unicode 轉義或其他字元轉義。因此必須在字元串字面值中使用兩個反斜線，表示正則表達式受到保護，不被 Java 位元組碼編譯器解釋。例如，當解釋為正則表達式時，字元串字面值 "\b" 與單個退格字元匹配，而 "\\b" 與單詞邊界匹配。字元串字面值 "$hello$" 是非法的，將導致編譯時錯誤；要與字元串 (hello) 匹配，必須使用字元串字面值 "\$hello\$"。

字元類
字元類可以出現在其他字元類中，並且可以包含並集運算符（隱式）和交集運算符 (&&)。並集運算符表示至少包含其某個操作數類中所有字元的類。交集運算符表示包含同時位於其兩個操作數類中所有字元的類。

字元類運算符的優先順序如下所示，按從最高到最低的順序排列：

1 字面值轉義 \x
2 分組 [...]
3 范圍 a-z
4 並集 [a-e][i-u]
5 交集 [a-z&&[aeiou]]

注意，元字元的不同集合實際上位於字元類的內部，而非字元類的外部。例如，正則表達式 . 在字元類內部就失去了其特殊意義，而表達式 - 變成了形成元字元的范圍。

行結束符
行結束符是一個或兩個字元的序列，標記輸入字元序列的行結尾。以下代碼被識別為行結束符：

新行（換行）符 ('\n')、
後面緊跟新行符的回車符 ("\r\n")、
單獨的回車符 ('\r')、
下一行字元 ('\u0085')、
行分隔符 ('\u2028') 或
段落分隔符 ('\u2029)。
如果激活 UNIX_LINES 模式，則新行符是惟一識別的行結束符。

如果未指定 DOTALL 標志，則正則表達式 . 可以與任何字元（行結束符除外）匹配。

默認情況下，正則表達式 ^ 和 $ 忽略行結束符，僅分別與整個輸入序列的開頭和結尾匹配。如果激活 MULTILINE 模式，則 ^ 在輸入的開頭和行結束符之後（輸入的結尾）才發生匹配。處於 MULTILINE 模式中時，$ 僅在行結束符之前或輸入序列的結尾處匹配。

組和捕獲
捕獲組可以通過從左到右計算其開括弧來編號。例如，在表達式 ((A)(B(C))) 中，存在四個這樣的組：

1 ((A)(B(C)))
2 \A
3 (B(C))
4 (C)

組零始終代表整個表達式。

之所以這樣命名捕獲組是因為在匹配中，保存了與這些組匹配的輸入序列的每個子序列。捕獲的子序列稍後可以通過 Back 引用在表達式中使用，也可以在匹配操作完成後從匹配器檢索。

與組關聯的捕獲輸入始終是與組最近匹配的子序列。如果由於量化的緣故再次計算了組，則在第二次計算失敗時將保留其以前捕獲的值（如果有的話）例如，將字元串 "aba" 與表達式 (a(b)?)+ 相匹配，會將第二組設置為 "b"。在每個匹配的開頭，所有捕獲的輸入都會被丟棄。

以 (?) 開頭的組是純的非捕獲組，它不捕獲文本，也不針對組合計進行計數。

閱讀全文

熱點內容

java是甲骨文發布：2025-03-14 21:21:38 瀏覽：125

柱頂要加密發布：2025-03-14 21:16:11 瀏覽：852

魔聲藍牙耳機怎麼在安卓顯示電量發布：2025-03-14 21:15:32 瀏覽：617

智慧易店伺服器地址是啥發布：2025-03-14 20:57:49 瀏覽：886

小米ID密碼忘記了有什麼危害發布：2025-03-14 20:45:28 瀏覽：610

大麥路由器怎麼改密碼發布：2025-03-14 20:35:42 瀏覽：87

資料庫片語發布：2025-03-14 20:27:21 瀏覽：248

角色卡演算法發布：2025-03-14 20:08:48 瀏覽：650

linux伺服器安全加固發布：2025-03-14 19:59:21 瀏覽：779

android系統資料庫發布：2025-03-14 19:44:27 瀏覽：237

正則java

不同情況下的正則表達式：

與正則java相關的資訊