java正則表達式詳解
A. java正則表達式,matcher.find和 matcher.matches的區別
1.find()方法是部分匹配,是查找輸入串中與模式匹配的子串,如果該匹配的串有組還可以使用group()函數。
matches()是全部匹配,是將整個輸入串與模式匹配,如果要驗證一個輸入的數據是否為數字類型或其他類型,一般要用matches()。
2.Pattern pattern= Pattern.compile(".*?,(.*)");
Matcher matcher = pattern.matcher(result);
if (matcher.find()) {
return matcher.group(1);
}
3.詳解:
matches
public static boolean matches(String regex, CharSequence input)
編譯給定正則表達式並嘗試將給定輸入與其匹配。
調用此便捷方法的形式
Pattern.matches(regex, input);
Pattern.compile(regex).matcher(input).matches() ;
如果要多次使用一種模式,編譯一次後重用此模式比每次都調用此方法效率更高。
參數:
regex - 要編譯的表達式
input - 要匹配的字元序列
拋出:
PatternSyntaxException - 如果表達式的語法無效
find
public boolean find()嘗試查找與該模式匹配的輸入序列的下一個子序列。
此方法從匹配器區域的開頭開始,如果該方法的前一次調用成功了並且從那時開始匹配器沒有被重置,則從以前匹配操作沒有匹配的第一個字元開始。
如果匹配成功,則可以通過 start、end 和 group 方法獲取更多信息。
matcher.start() 返回匹配到的子字元串在字元串中的索引位置.
matcher.end()返回匹配到的子字元串的最後一個字元在字元串中的索引位置.
matcher.group()返回匹配到的子字元串
返回:
當且僅當輸入序列的子序列匹配此匹配器的模式時才返回 true。
B. java中的正則表達式
Java正則表達式 (<img.*?)style=\".*?\" 替換成 $1
其中.*表示0個或0以上多個任意字元
.*?表示0個或0以上多個任意字元的非貪婪匹配,就是假如一個句子中有多個style,它匹配距離最近的那個style,同理後面的.*?匹配距離最近的雙引號
$1表示反向引用,它代表的是正則表達式中的第一個小括弧所括起來的分組的內容,如果有兩個小括弧括起來的內容,則分別用$1,$2表示它們(在替換後的字元串中)
完整的Java程序如下
123456public class CC { public static void main(String[] args) { String s="<img src=\"file/img/2016/12-28/1234-25521482893088459.jpg\" title=\"1234.jpg\" alt=\"\" width=\"396\" height=\"271\" style=\"width: 396px; height: 271px;\"/>"; System.out.println(s.replaceAll("(<img.*?)style=\".*?\"", "$1")); }}
運行結果
<img src="file/img/2016/12-28/1234-25521482893088459.jpg" title="1234.jpg" alt="" width="396" height="271" />
C. 關於java中正則表達式的一些語句理解
//下面是完整代碼,具體的分析都在代碼注釋里:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test6
{
public static void main(String[] args)
{
//正則表達式字元串:
// [] 內的數字表示取值可以是任意一個,
//\d 匹配一個數字字元。等價於[0-9]。
//\ 將下一個字元標記為一個特殊字元、或一個原義字元、或一個向後引用、或一個八進制轉義符。例如,「\\n」匹配\n。
//{n} n是一個非負整數。匹配確定的n次
String regex="1[3458][01256]\\d{8}";
String str="14057539559";
/*
Pattern類:
正則表達式的編譯表示形式。
指定為字元串的正則表達式必須首先被編譯為此類的實例。
然後,可將得到的模式用於創建 Matcher 對象,依照正則表達式,該對象可以與任意字元序列匹配。
執行匹配所涉及的所有狀態都駐留在匹配器中,所以多個匹配器可以共享同一模式。
compile方法:
static Pattern compile(String regex)
將給定的正則表達式編譯到模式中。
*/
Pattern pattern=Pattern.compile(regex);
/*
* Pattern的
matcher方法
根據要匹配的字元序列 ,創建匹配給定輸入與此模式的匹配器,然後返回此模式的新匹配器。
*/
Matcher matcher=pattern.matcher(str);
/*
* Matcher的
matches()方法
嘗試將整個區域與模式匹配。
當且僅當整個區域序列匹配此匹配器的模式時才返回 true。
*/
boolean bool=matcher.matches();
if (bool==true)
{
System.out.println("是聯通號");
}
else
{
System.out.println("不是聯通號");
}
}
/*
代碼如上:。我想問的是:
(1)Pattern pattern=Pattern.compile(regex); 這句話能不能幫我分析一下。
(2)Matcher matcher=pattern.matcher(str);分析一下這句話的作用和每一部的作用。
(3) boolean bool=matcher.matches();比較不需要傳入參數?
*/
}
D. java 正則表達式是什麼
不同情況下的正則表達式:
匹配首尾空格的正則表達式:(^s*)|(s*$)。
匹配html標簽的正則表達式:<(.*)>(.*)</(.*)>|<(.*)/>。
配空行的正則表達式: [s| ]* 。
整數或者小數:^[0-9]+.{0,1}[0-9]{0,2}$。
只能輸入數字:"^[0-9]*$"。
只能輸入n位的數字:"^d{n}$"。
只能輸入至少n位的數字:"^d{n,}$"。
只能輸入m~n位的數字:。"^d{m,n}$"
只能輸入零和非零開頭的數字:"^(0|[1-9][0-9]*)$"。
只能輸入有兩位小數的正實數:"^[0-9]+(.[0-9]{2})?$"。
只能輸入有1~3位小數的正實數:"^[0-9]+(.[0-9]{1,3})?$"。
只能輸入非零的正整數:"^+?[1-9][0-9]*$"。
只能輸入非零的負整數:"^-[1-9][]0-9"*$。
只能輸入長度為3的字元:"^.{3}$"。
只能輸入由26個英文字母組成的字元串:"^[A-Za-z]+$"。
只能輸入由26個大寫英文字母組成的字元串:"^[A-Z]+$"。
只能輸入由26個小寫英文字母組成的字元串:"^[a-z]+$"。
只能輸入由數字和26個英文字母組成的字元串:"^[A-Za-z0-9]+$"。
只能輸入由數字、26個英文字母或者下劃線組成的字元串:"^w+$"。
驗證用戶密碼:"^[a-zA-Z]w{5,17}$"正確格式為:以字母開頭,長度在6~18之間,只能包含字元、數字和下劃線。
驗證是否含有^%&',;=?$"等字元:"[^%&',;=?$x22]+"。
只能輸入漢字:"^[u4e00-u9fa5]{0,}$"。
驗證Email地址:"^w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$"。
驗證一年的12個月:"^(0?[1-9]|1[0-2])$"正確格式為:"01"~"09"和"1"~"12"。
驗證一個月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正確格式為;"01"~"09"和"1"~"31"。
匹配中文字元的正則表達式: [u4e00-u9fa5]。
匹配雙位元組字元(包括漢字在內):[^x00-xff]。
應用:計算字元串的長度(一個雙位元組字元長度計2,ASCII字元計1)String.prototype.len=function(){returnthis.replace(/[^x00-xff]/g,"aa").length;}。
E. 請詳細講解一下java正則表達式(d)(.)(=.*\\1)
(?s) 開啟單行模式 DOTALL 讓. 號匹配任意字元
(.) 任意字元 並捕獲在第一組
(?=.*\1) 這是斷言, 表示後面內容將是 任意個字元加上第一組所捕獲的內容
這樣子,如果這整個式子匹配到,表示,第一個捕獲組內容在字元串中,至少出現兩次,替換為 "" 空串.
F. Java中什麼是正則表達式
正則表達式 就是將一個類型的數據 按照一定方式 寫成正則表達式的形式 這樣可以辨別數據是否符合這一類型的數據 比如我們的身份證號碼 就是有一定的規則的 這樣我們寫一個 正則表達式 和別人輸入的身份證號碼 比對 如果符合這個正則表達式的規則 就是身份證號碼