javaxmldom4j解析

发布时间: 2023-06-17 00:15:40

1. java的xml的解析方式有什么，他们的解析流程是怎么样的，有什么区别

答：4种。（或者说是两种，因为JDOM和DOM4J是DOM的两个特殊情况）

1.SAX解析
解析方式是事件驱动机制！

SAX解析器，逐行读取XML文件解析，每当解析到一个标签的开始/结束/内容/属性时，触发事件。

可以在这些事件发生时，编写程序进行相应的处理。

优点：

分析能够立即开始，而不是等待所有的数据被处理。

逐行加载，节省内存，有助于解析大于系统内存的文档。

有时不必解析整个文档，它可以在某个条件得到满足时停止解析。

缺点：

1.单向解析，无法定位文档层次，无法同时访问同一个文档的不同部分数据（因为逐行解析，当解析第n行时，第n-1行）已经被释放了，无法再对其进行操作）。

2. 无法得知事件发生时元素的层次, 只能自己维护节点的父/子关系。

3. 只读解析方式, 无法修改XML文档的内容。

2. DOM解析
是用与平台和语言无关的方式表示XML文档的官方W3C标准，分析该结构通常需要加载整个文档和内存中建立文档树模型。程序员可以通过操作文档树, 来完成数据的获取修改删除等。

优点:

文档在内存中加载, 允许对数据和结构做出更改。访问是双向的，可以在任何时候在树中双向解析数据。

缺点:

文档全部加载在内存中 , 消耗资源大。

3. JDOM解析
目的是成为Java特定文档模型，它简化与XML的交互并且比使用DOM实现更快。由于是第一个Java特定模型，JDOM一直得到大力推广和促进。

JDOM文档声明其目的是“使用20%（或更少）的精力解决80%（或更多）Java/XML问题” （根据学习曲线假定为20%）

优点:

使用具体类而不是接口，简化了DOM的API。

大量使用了Java集合类，方便了Java开发人员。

缺点:

没有较好的灵活性。

性能不是那么优异。

4. DOM4J解析
它是JDOM的一种智能分支。它合并了许多超出基本XML文档表示的功能，包括集成的XPath 支持、XML Schema支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项， DOM4J是一个非常优秀的Java XML API，具有性能优异、功能强大和极端易用使用的特点，同时它也是一个开放源代码的软件。如今你可以看到越来越多的Java软件都在使用DOM4J来读写XML。

目前许多开源项目中大量采用DOM4J , 例如:Hibernate。

2. java 怎样解析 excel生成的xml文件

java解析excel生成的xml文件的方法是使用dom4j实现的。
dom4j是一个简单的开源库，用于处理XML、 XPath和XSLT，它基于Java平台，使用Java的集合框架，全面集成了DOM，SAX和JAXP。
1、excel生成的xml样例文件：
<?xml version="1.0"?>
<?mso-application progid="Excel.Sheet"?>
<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet"
xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:x="urn:schemas-microsoft-com:office:excel"
xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet"
xmlns:html="http://www.w3.org/TR/REC-html40">
<DocumentProperties xmlns="urn:schemas-microsoft-com:office:office">
<Created>2006-09-16T00:00:00Z</Created>
<LastSaved>2016-07-25T03:26:50Z</LastSaved>
<Version>14.00</Version>
</DocumentProperties>
<OfficeDocumentSettings xmlns="urn:schemas-microsoft-com:office:office">
<AllowPNG/>
<RemovePersonalInformation/>
</OfficeDocumentSettings>
<ExcelWorkbook xmlns="urn:schemas-microsoft-com:office:excel">
<WindowHeight>7956</WindowHeight>
<WindowWidth>14808</WindowWidth>
<WindowTopX>240</WindowTopX>
<WindowTopY>168</WindowTopY>
<ActiveSheet>2</ActiveSheet>
<ProtectStructure>False</ProtectStructure>
<ProtectWindows>False</ProtectWindows>
</ExcelWorkbook>
<Styles>
<Style ss:ID="Default" ss:Name="Normal">
<Alignment ss:Vertical="Bottom"/>
<Borders/>
<Font ss:FontName="宋体" x:CharSet="134" ss:Size="11" ss:Color="#000000"/>
<Interior/>
<NumberFormat/>
<Protection/>
</Style>
<Style ss:ID="s16" ss:Name="好">
<Font ss:FontName="宋体" x:CharSet="134" ss:Size="11" ss:Color="#006100"/>
<Interior ss:Color="#C6EFCE" ss:Pattern="Solid"/>
</Style>
<Style ss:ID="s17">
<Alignment ss:Horizontal="Left" ss:Vertical="Center" ss:Indent="1"
ss:WrapText="1"/>
<Font ss:FontName="宋体" x:CharSet="134" ss:Size="8" ss:Color="#686868"/>
<NumberFormat ss:Format="@"/>
</Style>
<Style ss:ID="s18" ss:Parent="s16">
<Alignment ss:Vertical="Bottom"/>
</Style>
<Style ss:ID="s19">
<NumberFormat ss:Format="yyyy/m/d\ h:mm:ss"/>
</Style>
</Styles>
<Worksheet ss:Name="Sheet1">
<Table ss:ExpandedColumnCount="6" ss:ExpandedRowCount="3" x:FullColumns="1"
x:FullRows="1" ss:DefaultRowHeight="14.4">
<Row>
<Cell><Data ss:Type="String">工号</Data></Cell>
<Cell><Data ss:Type="String">姓名 </Data></Cell>
<Cell ss:Index="5"><Data ss:Type="String">工号</Data></Cell>
<Cell><Data ss:Type="String">姓名</Data></Cell>
</Row>
<Row>
<Cell><Data ss:Type="Number">111</Data></Cell>
<Cell><Data ss:Type="String">张三</Data></Cell>
<Cell ss:Index="5"><Data ss:Type="Number">111</Data></Cell>
<Cell ss:Formula="=VLOOKUP(R2C5:R3C5,RC[-5]:R[1]C[-4],2)"><Data
ss:Type="String">张三</Data></Cell>
</Row>
<Row>
<Cell><Data ss:Type="Number">112</Data></Cell>
<Cell><Data ss:Type="String">李四</Data></Cell>
<Cell ss:Index="5"><Data ss:Type="Number">112</Data></Cell>
<Cell ss:Formula="=VLOOKUP(R2C5:R3C5,RC[-5]:R[1]C[-4],2)"><Data
ss:Type="String">李四</Data></Cell>
</Row>
</Table>
<WorksheetOptions xmlns="urn:schemas-microsoft-com:office:excel">
<PageSetup>
<Header x:Margin="0.3"/>
<Footer x:Margin="0.3"/>
<PageMargins x:Bottom="0.75" x:Left="0.7" x:Right="0.7" x:Top="0.75"/>
</PageSetup>
<Panes>
<Pane>
<Number>3</Number>
<ActiveRow>7</ActiveRow>
<ActiveCol>5</ActiveCol>
</Pane>
</Panes>
<ProtectObjects>False</ProtectObjects>
<ProtectScenarios>False</ProtectScenarios>
</WorksheetOptions>
</Worksheet>
</Workbook>
2、java解析代码：
import java.io.File;
import java.util.Iterator;
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
public class Demo {
public static void main(String[] args) throws Exception {
SAXReader reader = new SAXReader();
Document document = reader.read(new File("person.xml"));
Element root = document.getRootElement();

Iterator it = root.elementIterator();
while (it.hasNext()) {
Element element = (Element) it.next();

//未知属性名称情况下
/*Iterator attrIt = element.attributeIterator();
while (attrIt.hasNext()) {
Attribute a = (Attribute) attrIt.next();
System.out.println(a.getValue());
}*/

//已知属性名称情况下
System.out.println("id: " + element.attributeValue("id"));

//未知元素名情况下
/*Iterator eleIt = element.elementIterator();
while (eleIt.hasNext()) {
Element e = (Element) eleIt.next();
System.out.println(e.getName() + ": " + e.getText());
}
System.out.println();*/

//已知元素名情况下
System.out.println("title: " + element.elementText("title"));
System.out.println("author: " + element.elementText("author"));
System.out.println();
}
}
}

3. 在java中解析xml有哪几种方法

(1)DOM解析
DOM是html和xml的应用程序接口(API)，以层次结构（类似于树型）来组织节点和信息片段，映射XML文档的结构，允许获取
和操作文档的任意部分，是W3C的官方标准
【优点】
①允许应用程序对数据和结构做出更改。
②访问是双向的，可以在任何时候在树中上下导航，获取和操作任意部分的数据。
【缺点】
①通常需要加载整个XML文档来构造层次结构，消耗资源大。
【解析详解】
①构建Document对象：
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = bdf.newDocumentBuilder();
InputStream is = Thread.currentThread().getContextClassLoader().getResourceAsStream(xml文件);
Document doc = bd.parse(is);
②遍历DOM对象
Document： XML文档对象，由解析器获取
NodeList：节点数组
Node：节点(包括element、#text)
Element：元素，可用于获取属性参数
(2)SAX(Simple API for XML)解析
流模型中的"推"模型分析方式。通过事件驱动，每发现一个节点就引发一个事件，事件推给事件处理器，通过回调方法
完成解析工作，解析XML文档的逻辑需要应用程序完成
【优势】
①不需要等待所有数据都被处理，分析就能立即开始。
②只在读取数据时检查数据，不需要保存在内存中。
③可以在某个条件得到满足时停止解析，不必解析整个文档。
④效率和性能较高，能解析大于系统内存的文档。
【缺点】
①需要应用程序自己负责TAG的处理逻辑（例如维护父/子关系等），文档越复杂程序就越复杂。
②单向导航，无法定位文档层次，很难同时访问同一文档的不同部分数据，不支持XPath。
【原理】
简单的说就是对文档进行顺序扫描，当扫描到文档(document)开始与结束、元素(element)开始与结束时通知事件
处理函数(回调函数)，进行相应处理，直到文档结束
【事件处理器类型】
①访问XML DTD：DTDHandler
②低级访问解析错误：ErrorHandler
③访问文档内容：ContextHandler
【DefaultHandler类】
SAX事件处理程序的默认基类，实现了DTDHandler、ErrorHandler、ContextHandler和EntityResolver接口，通常
做法是，继承该基类，重写需要的方法，如startDocument()
【创建SAX解析器】
SAXParserFactory saxf = SAXParserFactory.newInstance();
SAXParser sax = saxf.newSAXParser();
注：关于遍历
①深度优先遍历(Depthi-First Traserval)
②广度优先遍历(Width-First Traserval)
(3)JDOM(Java-based Document Object Model)
Java特定的文档对象模型。自身不包含解析器，使用SAX
【优点】
①使用具体类而不是接口，简化了DOM的API。
②大量使用了Java集合类，方便了Java开发人员。
【缺点】
①没有较好的灵活性。
②性能较差。
(4)DOM4J(Document Object Model for Java)
简单易用，采用Java集合框架，并完全支持DOM、SAX和JAXP
【优点】
①大量使用了Java集合类，方便Java开发人员，同时提供一些提高性能的替代方法。
②支持XPath。
③有很好的性能。
【缺点】
①大量使用了接口，API较为复杂。
(5)StAX(Streaming API for XML)
流模型中的拉模型分析方式。提供基于指针和基于迭代器两种方式的支持,JDK1.6新特性
【和推式解析相比的优点】
①在拉式解析中，事件是由解析应用产生的，因此拉式解析中向客户端提供的是解析规则，而不是解析器。
②同推式解析相比，拉式解析的代码更简单，而且不用那么多库。
③拉式解析客户端能够一次读取多个XML文件。
④拉式解析允许你过滤XML文件和跳过解析事件。
【简介】
StAX API的实现是使用了Java Web服务开发（JWSDP）1.6，并结合了Sun Java流式XML分析器(SJSXP)-它位于
javax.xml.stream包中。XMLStreamReader接口用于分析一个XML文档，而XMLStreamWriter接口用于生成一个
XML文档。XMLEventReader负责使用一个对象事件迭代子分析XML事件-这与XMLStreamReader所使用的光标机制
形成对照。

4. 在java中怎么用dom4j解析XML文件

以下是曾经写的一个解析XML获取XML中图片流的字符串，获取并转化为图片的工具类

里面海带哟base64编码，具体代码如下，希望能帮到你

packagecom.asidel.web.util;

importjava.io.File;
importjava.io.FileOutputStream;
importjava.io.OutputStream;
importjava.util.Iterator;
importjava.util.List;

importorg.dom4j.Document;
importorg.dom4j.DocumentHelper;
importorg.dom4j.Element;

importsun.misc.BASE64Decoder;
importsun.misc.BASE64Encoder;

importcom.dragonsoft.adapter.AdapterSend;

publicclassXMLparserUtil{

	/**
	*@Title:getXp
	*@Description:解析XML
	*@return
	*/
	publicstaticStringgetXp(StringxmlStr,Stringsfzh){
		Stringxp="";
		try{
			//将String转化成xml
			Documentdocument=DocumentHelper.parseText(xmlStr);

			//获取Value节点下的Row子节点
			ListRowElementList=XMLparserUtil.getRowElementList(document);
			if(RowElementList!=null&&RowElementList.size()>0){
				ElementRowElement3=(Element)RowElementList.get(RowElementList.size()-1);
				//根据节点获取值
				StringxpBase64=RowElement3.elementTextTrim("Data");
				//System.out.println("xpBase64:"+xpBase64);
				if(!"".equals(xpBase64)&&xpBase64!=null){
					xp=XMLparserUtil.getDecodingBASE64(xpBase64,sfzh);
				}
				//System.out.println("xp:"+xp);
			}

		}catch(Exceptione){
			//TODOAuto-generatedcatchblock
			e.printStackTrace();
			xp="";
		}
		returnxp;
	}

	/**
	*@Title:getEncodingBASE64
	*@Description:进行BASE64编码
	*@paramstring
	*@return
	*/
	(Stringstring){
		StringreturnStr="";
		if(!"".equals(string)&&string!=null){
			try{
				BASE64Encoderbase64Encoder=newBASE64Encoder();
				returnStr=base64Encoder.encode(string.getBytes());
			}catch(Exceptione){
				//TODO:handleexception
				e.printStackTrace();
			}
		}
		returnreturnStr;
	}

	/**
	*@Title:getDecodingBASE64
	*@Description:将BASE64编码的字符串进行解码
	*@paramstring
	*@return
	*/
	(StringimgStr,StringimgName){
		StringimgFilePath="";//新生成的图片
		BASE64Decoderdecoder=newBASE64Decoder();
		if(!"".equals(imgStr)&&imgStr!=null){
			try{
				byte[]b=decoder.decodeBuffer(imgStr);
				for(inti=0;i<b.length;++i){
					if(b[i]<0){//调整异常数据
						b[i]+=256;
					}
				}
				//生成jpeg图片
				PathUtilpathUtil=newPathUtil();
				Stringzdryxppath=pathUtil.getWebRoot()+"uploadImages/";
				System.out.println("zdryxppath="+zdryxppath);
				FilepathDir=newFile(zdryxppath);//如果目录不存在就创建该目录
				if(!pathDir.exists()){
					pathDir.mkdirs();
				}
				StringimgFileRealPath=zdryxppath+imgName+".jpg";//新生成的图片
				OutputStreamout=newFileOutputStream(imgFileRealPath);
				out.write(b);
				out.flush();
				out.close();
				imgFilePath="uploadImages/"+imgName+".jpg";
			}catch(Exceptione){
				e.printStackTrace();
			}
		}
		returnimgFilePath;
	}

	/**
	*@Title:getRowElementList
	*@Description:获取节点列表
	*@paramdocument
	*@paramstring
	*@return
	*
	*/
	(Documentdocument){

		ListreturnRowElementList=null;
		//获取根节点
		ElementrootElement=document.getRootElement();
		//System.out.println("rootElement:"+rootElement);
		//获取根节点下的Method子节点
		IteratorMethodElementList=rootElement.elementIterator("Method");
		//遍历Method节点
		while(MethodElementList.hasNext()){
			ElementMethodElement=(Element)MethodElementList.next();
			//System.out.println("Method:"+MethodElement);
			//获取Method节点下的Items子节点
			IteratorItemsElementList=MethodElement.elementIterator("Items");
			//遍历Items节点
			while(ItemsElementList.hasNext()){
				ElementItemsElement=(Element)ItemsElementList.next();
				//System.out.println("Items:"+ItemsElement);
				//获取Items节点下的Item子节点
				IteratorItemElementList=ItemsElement.elementIterator("Item");
				//遍历Item节点
				while(ItemElementList.hasNext()){
					ElementItemElement=(Element)ItemElementList.next();
					//System.out.println("Item:"+ItemElement);
					//获取Item节点下的Value子节点
					IteratorValueElementList=ItemElement.elementIterator("Value");
					//遍历Value节点
					while(ValueElementList.hasNext()){
						ElementValueElement=(Element)ValueElementList.next();
						//System.out.println("Value:"+ValueElement);
						returnRowElementList=ValueElement.elements("Row");
						////获取Value节点下的Row子节点
						//List
						//if(RowElementList!=null&&RowElementList.size()>
						//0){
						//ElementRowElement3=(Element)
						//RowElementList.get(RowElementList.size()-1);
						////System.out.println("Row:"+RowElement3);
						////根据节点获取值
						//xp=RowElement3.elementTextTrim("Data");
						//System.out.println("xp:"+xp);
						//}
					}
				}
			}
		}

		returnreturnRowElementList;
	}

	publicstaticvoidmain(String[]args){}
}

5. java中dom4j解析xml文件怎么获取节点属性

dom4j中，使用Element.attributes方法可以获取到节点的属性，而使用elements则可以获取相应的子节点
比如：
Element root = doc.getRootElement();
List attrList = root.attributes();
for (int i = 0; i < attrList.size(); i++) {
//属性的取得
Attribute item = (Attribute)attrList.get(i);
System.out.println(item.getName() + "=" + item.getValue());
}
List childList = root.elements();
for (int i = 0; i < childList.size(); i++) {
//子节点的操作
Element it = (Element) childList.get(i);
//对子节点进行其它操作...
}

阅读全文

热点内容

android访问网络权限发布：2025-02-12 14:55:20 浏览：88

原神文件夹发布：2025-02-12 14:50:15 浏览：800

c语言数字翻译发布：2025-02-12 14:45:54 浏览：497

暗区突围为什么显示服务器维修发布：2025-02-12 14:45:53 浏览：247

翻译分为汇编和编译发布：2025-02-12 14:29:12 浏览：233

什么是新闻编译发布：2025-02-12 14:23:12 浏览：853

如何查看手机存储发布：2025-02-12 14:21:15 浏览：50

cacti自定义脚本发布：2025-02-12 14:21:13 浏览：313

编译安卓步骤发布：2025-02-12 14:19:39 浏览：222

php把数组分组发布：2025-02-12 14:19:37 浏览：280

javaxmldom4j解析

与javaxmldom4j解析相关的资讯