當前位置:首頁 » 編程語言 » java正則表達式html

java正則表達式html

發布時間: 2022-09-01 22:47:33

1. java正則表達式解析HTML字元串

1.首先提取<R_Data> 之間的內容. 我覺得不需要用 正則.
int start= str.indexOf(">",0);//返回 字元串 <R_Date> ">" 的索引 其中str 是整個字元串
int end =str.indexOf("<",start); //返回 </R_Data> 中"<" 的索引.
String s=subString(str,start,end); 這樣就可以去掉 這對標簽了. //s 是去掉標簽之後的字元串
2. String[] sa=s.split("|"); 用 | 把這個字元串分割開. 結果返回的是一個 字元串數組.
例如 :0005,實驗室0,0,0
1239,實驗室B-測試點1,50,150
3.想要 這個樣子的數組 String[] str={「0005","實驗室0","0","0"} 可以將 上述sa 數組中的 每個元素繼續分割.
如 String[] ss = sa[0].split(",",2)
思路就是這樣 可能有一些細節上的問題. 遇到了問題 再 追問

2. java 正則表達式 匹配html標簽段

<head>
<script language="javascript">
var G=document.getElementById;
function window_load(){
var strHTML = ""; // document.body.innerHTML;
strHTML += "<html>";
strHTML += " <head>";
strHTML += " </head>";
strHTML += " <body>";
strHTML += " <font color='red'>test1</font><br />";
strHTML += " <font size='18'>test2</font><br />";
strHTML += " <font >test3</font><br />";
strHTML += " <font></font>";
strHTML += " </body>";
strHTML += "</html>";

var reg = /<(font)\s*[^<>]*>[^<>]*<\/\1\s*>/ig;

var aryResult = strHTML.match(reg);
alert("用match方法匹配 ,結果:\n\n" + aryResult.join("\n"));
}
</script>
</head>
<body onload="window_load();"> \
<!--
<font color='red'>test1</font><br />
<font size='18'>test2</font><br />
<font >test3</font><br />
<font></font>
-->
</body>
</html>

3. Java用正則表達式獲取html里的一段內容

String strLine="<a id=\"utilAllProd\" class=\"utilAllProdAct\" href=\"javascript:;\"><span class=\"utilNumbProd\">(500+)</span></a>\r\n"
+"\r\n <a id=\"utilSearsProd\" class=\"cursorPointer\" onclick=\"sellerTabsOmniture('View Sears Only Procts');\" href=\"/search=digital camera&Sears?filter=storeOrigin&keywordSearch=false&vName=Cameras+%26+Camcorders&catalogId=12605&previousSort=ORIGINAL_SORT_ORDER&viewItems=50&storeId=10153&cName=Digital+Cameras\"><span class=\"utilNumbProd\">(286)</span></a>";

Pattern pa = Pattern.compile("<span class=\"utilNumbProd\">\\((\\d+[\\+]*)\\)</span>");
Matcher ma = pa.matcher(strLine);
while (ma.find()) {
String text=ma.group(1);
System.out.println(text);
}

4. 【Java作業向】正則表達式過濾HTML標簽

過濾HTML標簽的Java正則表達式 (?s)<.*?/?.*?>

按照你的要求編寫的用正則表達式過濾HTML標簽的Java程序如下

public class AA {

public String tagFilter(String s){

String regex = "(?s)<.*?/?.*?>";

String ss=s.replaceAll(regex,"");

return ss;

}

public static void main(String[] args) {

String s="<div class="guid time online">測試 abc</div><span data-url="games/details/" class="guid done">你好13548</span><a href="games/details/" class="guid">15個字母Abc</a><i class="icon-guid"/>";

String result=new AA().tagFilter(s);

System.out.println(result);

}

}

5. java中的正則表達式與HTML正則表達式有什麼區別

語法沒有區別,更正下不是html是javascript

唯一的區別在於 java中\轉義要使用兩次
例如:只能是一個數字
java中是: "\\d"
javascript中是:/\d/

6. java正則表達式替換html中除標簽外的關鍵字內容

\b{keywords}\b(?=[^<>]*<)
把上面{keywords}替換成你的關鍵字,注意把{}也替換掉,我是為了讓你看明白換哪才加的{}。
然後你找到匹配上面的正則的地方後替換成你想替換的字元串就好了,全部替換記得用全局修飾符

7. java正則表達式去除html標簽保留指定標簽

String reg = "<\\/?html[^>]*>";
String html = "";
html.replaceAll(reg,"");

8. java正則表達式獲取任意兩個html標簽中的內容

import java.util.regex.*;
public class RegexExample {
public static void main(String []args) {
String content=獲取的網頁內容;
Pattern p=Pattern.compile("<div class=\"fliter_px\">([\\s\\S]+?)<div class=\"search_page\">");
Matcher m=p.matcher(content);
if(m.find()){
System.out.println(m.group(1));
}
}
}

熱點內容
全鍵盤編程鍵盤 發布:2025-01-16 01:38:59 瀏覽:421
尾貨棉服直播間腳本 發布:2025-01-16 01:21:45 瀏覽:227
vb編程步驟 發布:2025-01-16 01:11:58 瀏覽:201
bb霜解壓 發布:2025-01-16 01:11:11 瀏覽:596
編程懟人 發布:2025-01-16 00:53:08 瀏覽:760
建立共享伺服器地址 發布:2025-01-16 00:26:40 瀏覽:565
android開機動畫修改 發布:2025-01-16 00:26:26 瀏覽:872
怎麼解壓pc版游戲 發布:2025-01-16 00:16:32 瀏覽:122
v9更新到91有方舟編譯器嗎 發布:2025-01-16 00:11:49 瀏覽:500
AB系統編程 發布:2025-01-16 00:09:37 瀏覽:621