java正则html

发布时间: 2023-10-10 16:50:58

㈠【java作业向】正则表达式过滤HTML标签

过滤HTML标签的Java正则表达式 (?s)<.*?/?.*?>

按照你的要求编写的用正则表达式过滤HTML标签的Java程序如下

public class AA {

public String tagFilter(String s){

String regex = "(?s)<.*?/?.*?>";

String ss=s.replaceAll(regex,"");

return ss;

}

public static void main(String[] args) {

String s="<div class="guid time online">测试 abc</div>你好13548<a href="games/details/" class="guid">15个字母Abc</a>";

String result=new AA().tagFilter(s);

System.out.println(result);

}

㈡ java 正则表达式匹配html标签段

<head>
<script language="javascript">
var G=document.getElementById;
function window_load(){
var strHTML = ""; // document.body.innerHTML;
strHTML += "<html>";
strHTML += " <head>";
strHTML += " </head>";
strHTML += " <body>";
strHTML += " test1 ";
strHTML += " test2 ";
strHTML += " test3 ";
strHTML += " ";
strHTML += " </body>";
strHTML += "</html>";

var reg = /<(font)\s*[^<>]*>[^<>]*<\/\1\s*>/ig;

var aryResult = strHTML.match(reg);
alert("用match方法匹配 ,结果:\n\n" + aryResult.join("\n"));
}
</script>
</head>
<body onload="window_load();"> \

</body>
</html>

㈢ java正则表达式获取任意两个html标签中的内容

import java.util.regex.*;
public class RegexExample {
public static void main(String []args) {
String content=获取的网页内容;
Pattern p=Pattern.compile("<div class=\"fliter_px\">([\\s\\S]+?)<div class=\"search_page\">");
Matcher m=p.matcher(content);
if(m.find()){
System.out.println(m.group(1));
}
}
}

㈣ java 如何利用正则表达式只保留html里面的标签里面的内容

正则表达式：<p.*?>(.*?)
group(1)为正文内容。
输出时加上\n就行了

import java.util.regex.*;
public class Test{
public static void main(String[] args){
String str="No page with that title exists. ";
String regex="<p.*?>(.*?) ";
Pattern p =Pattern.compile(regex);
Matcher m=p.matcher(str);
while(m.find()){
System.out.println(m.group(1));
}
}
}

㈤如何使用java的正则表达式提取html标签

importjava.util.ArrayList;
importjava.util.Iterator;
importjava.util.List;
importjava.util.regex.Matcher;
importjava.util.regex.Pattern;

publicclassTest{

publicstaticvoidmain(Stringargs[]){
Stringhtml="<title>ABCD</title>gsdggas<title></title>jkll<title>005</title>";
//简单示例，相当于Stringhtml=getHtml(StringurlString);
ListresultList=getContext(html);
for(Iteratoriterator=resultList.iterator();iterator.hasNext();){
Stringcontext=(String)iterator.next();
System.out.println(context);
}
}

/**
*提取"<title>XXXX</title>"中的文字XXXX
*@paramhtml要解析的html文档内容
*@return解析结果，可以多次匹配，每次匹配的结果按文档中出现的先后顺序添加进结果List
*/
publicstaticListgetContext(Stringhtml){
ListresultList=newArrayList();
Patternp=Pattern.compile("<title>([^</title>]*)");//匹配<title>开头，</title>结尾的文档
Matcherm=p.matcher(html);//开始编译
while(m.find()){
resultList.add(m.group(1));//获取被匹配的部分
}
returnresultList;
}
}

㈥ JAVA正则表达式解析HTML字符串

1.首先提取<R_Data> 之间的内容. 我觉得不需要用正则.
int start= str.indexOf(">",0);//返回字符串 <R_Date> ">" 的索引其中str 是整个字符串
int end =str.indexOf("<",start); //返回 </R_Data> 中"<" 的索引.
String s=subString(str,start,end); 这样就可以去掉这对标签了. //s 是去掉标签之后的字符串
2. String[] sa=s.split("|"); 用 | 把这个字符串分割开. 结果返回的是一个字符串数组.
例如 :0005,实验室0,0,0
1239,实验室B-测试点1,50,150
3.想要这个样子的数组 String[] str={“0005","实验室0","0","0"} 可以将上述sa 数组中的每个元素继续分割.
如 String[] ss = sa[0].split(",",2)
思路就是这样可能有一些细节上的问题. 遇到了问题再追问

阅读全文

热点内容

爱奇艺会员怎么改密码发布：2025-03-06 11:33:44 浏览：58

firefox不缓存发布：2025-03-06 11:33:43 浏览：464

淘宝密码如何破解发布：2025-03-06 11:32:56 浏览：591

sqlservereclipse 发布：2025-03-06 11:25:29 浏览：704

linux存放文件发布：2025-03-06 11:24:47 浏览：444

nfslinux挂载发布：2025-03-06 11:19:42 浏览：233

安卓动态壁纸怎么提取发布：2025-03-06 11:07:26 浏览：111

有锁安卓手机有什么坏处发布：2025-03-06 11:00:20 浏览：575

dvwa上传发布：2025-03-06 10:46:58 浏览：699

新款荣放低配有哪些新配置发布：2025-03-06 10:41:29 浏览：791

java正则html

与java正则html相关的资讯