java解析xml

發布時間: 2023-09-07 16:27:12

1. java解析xml的幾種方式哪種最好

(1)DOM解析

DOM是html和xml的應用程序介面(API)，以層次結構（類似於樹型）來組織節點和信息片段，映射XML文檔的結構，允許獲取;

(2)SAX(Simple API for XML)解析

流模型中的"推"模型分析方式。通過事件驅動，每發現一個節點就引發一個事件，事件推給事件處理器，通過回調方法;

2. java解析xml文件

SaxReader reader = new SaxReader();
Document doc = reader.read(new File("class.xml"));
Element element = doc.getRootElement();//獲取根元素

迭代器：取根元素下的子元素名稱
Iterator<Element> iter = element.elementIterator();
while(iter.hashNext){
Element el = (Element)iter.next();
el.getName();//獲取元素名稱
el.getText();//獲取元素值
}

//獲取屬性名稱、值
Iterator<Attribute> iter1 = element.attributeIterator();
while(iter1.hashNext()){
Attribute el = (Attribute)iter1.next();
el.getName();el.getValue();//獲取屬性名稱和值
}

如果取所有，則用遞歸取：
public void getInfo(Element root){
Iterator<Element> iter = root.getElementIterator();
while(iter.hashNext()){
Element element = (Element)iter.next();
getInfo(element);//自己調用自己遞歸方法
}
}

3. java的xml的解析方式有什麼，他們的解析流程是怎麼樣的，有什麼區別

答：4種。（或者說是兩種，因為JDOM和DOM4J是DOM的兩個特殊情況）

1.SAX解析
解析方式是事件驅動機制！

SAX解析器，逐行讀取XML文件解析，每當解析到一個標簽的開始/結束/內容/屬性時，觸發事件。

可以在這些事件發生時，編寫程序進行相應的處理。

優點：

分析能夠立即開始，而不是等待所有的數據被處理。

逐行載入，節省內存，有助於解析大於系統內存的文檔。

有時不必解析整個文檔，它可以在某個條件得到滿足時停止解析。

缺點：

1.單向解析，無法定位文檔層次，無法同時訪問同一個文檔的不同部分數據（因為逐行解析，當解析第n行時，第n-1行）已經被釋放了，無法再對其進行操作）。

2. 無法得知事件發生時元素的層次, 只能自己維護節點的父/子關系。

3. 只讀解析方式, 無法修改XML文檔的內容。

2. DOM解析
是用與平台和語言無關的方式表示XML文檔的官方W3C標准，分析該結構通常需要載入整個文檔和內存中建立文檔樹模型。程序員可以通過操作文檔樹, 來完成數據的獲取修改刪除等。

優點:

文檔在內存中載入, 允許對數據和結構做出更改。訪問是雙向的，可以在任何時候在樹中雙向解析數據。

缺點:

文檔全部載入在內存中 , 消耗資源大。

3. JDOM解析
目的是成為Java特定文檔模型，它簡化與XML的交互並且比使用DOM實現更快。由於是第一個Java特定模型，JDOM一直得到大力推廣和促進。

JDOM文檔聲明其目的是「使用20%（或更少）的精力解決80%（或更多）Java/XML問題」（根據學習曲線假定為20%）

優點:

使用具體類而不是介面，簡化了DOM的API。

大量使用了Java集合類，方便了Java開發人員。

缺點:

沒有較好的靈活性。

性能不是那麼優異。

4. DOM4J解析
它是JDOM的一種智能分支。它合並了許多超出基本XML文檔表示的功能，包括集成的XPath 支持、XML Schema支持以及用於大文檔或流化文檔的基於事件的處理。它還提供了構建文檔表示的選項， DOM4J是一個非常優秀的Java XML API，具有性能優異、功能強大和極端易用使用的特點，同時它也是一個開放源代碼的軟體。如今你可以看到越來越多的Java軟體都在使用DOM4J來讀寫XML。

目前許多開源項目中大量採用DOM4J , 例如:Hibernate。

4. Java解析XML的幾種方法

DOM解析
①構建Document對象：

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

DocumentBuilder db = bdf.newDocumentBuilder();

InputStream is = Thread.currentThread().getContextClassLoader().getResourceAsStream(xml文件);

Document doc = bd.parse(is);

②遍歷DOM對象

Document： XML文檔對象，由解析器獲取

NodeList：節點數組

Node：節點(包括element、#text)

Element：元素，可用於獲取屬性參數

SAX(Simple API for XML)解析
【DefaultHandler類】

SAX事件處理程序的默認基類，實現了DTDHandler、ErrorHandler、ContextHandler和EntityResolver介面，通常
做法是，繼承該基類，重寫需要的方法，如startDocument()

【創建SAX解析器】

SAXParserFactory saxf = SAXParserFactory.newInstance();

SAXParser sax = saxf.newSAXParser();

註：關於遍歷

①深度優先遍歷(Depthi-First Traserval)

②廣度優先遍歷(Width-First Traserval)
JDOM(Java-based Document Object Model)
DOM4J(Document Object Model for Java)
StAX(Streaming API for XML)

5. java XML解析詳解

(I)Java通過DOM解析XML

1>得到DOM解析器的工廠實例
DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance();
得到javax.xml.parsers.DocumentBuilderFactory;類的實例就是我們要的解析器工廠

2>從DOM工廠獲得DOM解析器
DocumentBuilder dombuilder=domfac.newDocumentBuilder();
通過javax.xml.parsers.DocumentBuilderFactory實例的靜態方法newDocumentBuilder()得到DOM解析器

3>把要解析的XML文檔轉化為輸入流，以便DOM解析器解析它
InputStream is=new FileInputStream("bin/library.xml");
InputStream是一個介面。
4>解析XML文檔的輸入流，得到一個Document
Document doc=dombuilder.parse(is);
由XML文檔的輸入流得到一個org.w3c.dom.Document對象，以後的處理都是對Document對象進行的

5>得到XML文檔的根節點
Element root=doc.getDocumentElement();
在DOM中只有根節點是一個org.w3c.dom.Element對象。

6>得到節點的子節點
NodeList books=root.getChildNodes();
for(int i=0;i<books.getLength();i++){
Node book=books.item(i);
}
這是用一個org.w3c.dom.NodeList介面來存放它所有子節點的，還有一種輪循子節點的方法，後面有介紹

7>取得節點的屬性值
String email=book.getAttributes().getNamedItem("email").getNodeValue();
System.out.println(email);
注意，節點的屬性也是它的子節點。它的節點類型也是Node.ELEMENT_NODE

8>輪循子節點
for(Node node=book.getFirstChild();node!=null;node=node.getNextSibling()){

if(node.getNodeType()==Node.ELEMENT_NODE){

if(node.getNodeName().equals("name")){

String name=node.getNodeValue();

String name1=node.getFirstChild().getNodeValue();

...

if(node.getNodeName().equals("price")){

String price=node.getFirstChild().getNodeValue();
...

Java通過SAX解析XML
Simple API for XML（簡稱SAX）是個循序存取XML的解析器API。
一個實現SAX的解析器（也就是「SAX Parser」）以一個串流解析器的型式作用，擁有事件驅動API。由使用者定義回調函數，解析時，若發生事件的話會被調用。SAX事件包括：
XML 文字節點
XML 元素節點
XML 處理指令
XML 注釋

Java代碼
<person>
<user>
<username>謝成志</username>
<password>6626310xie</password>
<sex>男</sex>
<birthday>1988/11/28</birthday>
<headpic>
<pictitle>ermao</pictitle>
<picurl>images/head1.jpg</picurl>
</headpic>
</user>
</person>

此為下面即將解析度簡單xml結構，並將其封裝成一個User對象。

////////////////////////////////////////////////////////////////////////////////////

Java代碼
<span style="font-family: courier new,courier; font-size: small;">package com.xcz.xml;

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.SAXException;

import com.xcz.util.SaxUtil;

public class Sax4XML {

public static void main(String[] args) {

try {
//1.獲取factory
SAXParserFactory factory = SAXParserFactory.newInstance();
//2.獲取parser
SAXParser parser = factory.newSAXParser();
//3.獲取解析時的監聽器對象
SaxUtil su = new SaxUtil();
//4.開始解析
parser.parse(new File("src/user-params.xml"), su);

System.out.println(su.getUser());

} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}

}
}
</span>

////////////////////////////////////////////////////////////////////////////////////

Java代碼
<span style="font-family: courier new,courier; font-size: small;">package com.xcz.util;

import java.text.ParseException;
import java.text.SimpleDateFormat;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import com.xcz.po.HeadPic;
import com.xcz.po.User;

/**
* 定義xml解析時的監聽類
*
* 實現方式有很多，可以實現介面：ContentHandler，DTDHandler， EntityResolver 和 ErrorHandler
* 但我們常用的繼承：DefaultHandler
*/
public class SaxUtil extends DefaultHandler {

private User user;
private HeadPic headPic;
private String content;
private SimpleDateFormat sdf = new SimpleDateFormat("yyyy/MM/dd");

@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
content = new String(ch, start, length);
}

//當解析到文本開始時觸發
@Override
public void startDocument() throws SAXException {
super.startDocument();
}

//當解析到文本結束時觸發
@Override
public void endDocument() throws SAXException {
super.endDocument();
}

//當解析到元素開始時觸發
@Override
public void startElement(String uri, String localName, String name,
Attributes attributes) throws SAXException
{
if("user".equals(name))
{
user = new User();
}
if("headpic".equals(name))
{
headPic = new HeadPic();
}
}

//當解析到元素結束時觸發
@Override
public void endElement(String uri, String localName, String name)
throws SAXException
{
if("username".equals(name))
{
user.setUsername(content);
}
if("password".equals(name))
{
user.setPassword(content);
}
if("sex".equals(name))
{
user.setSex(content);
}
if("birthday".equals(name))
{
try {
user.setBirthday(sdf.parse(content));
} catch (ParseException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
if("pictitle".equals(name))
{
headPic.setPicTitle(content);
}
if("picurl".equals(name))
{
headPic.setPicUrl(content);
user.setHeadPic(headPic);
}

}

public User getUser(){
return user;
}

}</span>

[優點]

(1).節約內存開銷

SAX解析器在某些方面優於DOM風格解析器，因為SAX解析器的內存使用量一般遠低於DOM解析器使用量。DOM解析器在任何處理開始之前，必須將xml以整棵樹放在內存，所以DOM解析器的內存使用量完全根據輸入資料的大小。相對來說，SAX解析器的內存內容，是只基於XML檔案的最大深度（XML樹的最大深度）和單一XML項目上XML屬性儲存的最大資料。

(2)解析速度快

因為SAX事件驅動的本質，處理文件通常會比DOM風格的解析器快。

[缺點]

SAX事件驅動的模型對於XML解析很有用，但它確實有某些缺點。

某些種類的XML驗證需要存取整份文件。例如，一個DTD IDREF屬性需要文件內有項目使用指定字串當成DTD ID屬性。要在SAX解析器內驗證，必須追蹤每個之前遇過的ID和IDREF屬性，檢查是否有任何相符。更甚者，一個IDREF找不到對應的ID，使用者只會在整份文件都解析完後才發現，若這種連結對於建立有效輸出是重要的，那用在處理整份文件的時間只是浪費。

6. 在java在如何解析XML文件

在java環境下讀取xml文件的方法主要有4種：DOM、SAX、JDOM、JAXB
1. DOM(Document Object Model)
此方法主要由W3C提供，它將xml文件全部讀入內存中，然後將各個元素組成一棵數據樹，以便快速的訪問各個節點。因此非常消耗系統性能，對比較大的文檔不適宜採用DOM方法來解析。 DOM API 直接沿襲了 XML 規范。每個結點都可以擴展的基於 Node 的介面，就多態性的觀點來講，它是優秀的，但是在 Java 語言中的應用不方便，並且可讀性不強。
實例：
import javax.xml.parsers.*;
//XML解析器介面
import org.w3c.dom.*;
//XML的DOM實現
import org.apache.crimson.tree.XmlDocument;
//寫XML文件要用到

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
//允許名字空間
factory.setNamespaceAware(true);
//允許驗證
factory.setValidating(true);
//獲得DocumentBuilder的一個實例
try {
DocumentBuilder builder = factory.newDocumentBuilder();
} catch (ParserConfigurationException pce) {
System.err.println(pce);
// 出異常時輸出異常信息，然後退出，下同
System.exit(1);
}
//解析文檔，並獲得一個Document實例。
try {
Document doc = builder.parse(fileURI);
} catch (DOMException dom) {
System.err.println(dom.getMessage());
System.exit(1);
} catch (IOException ioe) {
System.err.println(ioe);
System.exit(1);
}

//獲得根節點StuInfo
Element elmtStuInfo = doc.getDocumentElement();

//得到所有student節點
NodeList nlStudent = elmtStuInfo.getElementsByTagNameNS(
strNamespace, "student");
for (……){
//當前student節點元素
Element elmtStudent = (Element)nlStudent.item(i);

NodeList nlCurrent = elmtStudent.getElementsByTagNameNS(
strNamespace, "name");
}

閱讀全文

熱點內容

linux關閉445埠發布：2025-03-12 13:20:47 瀏覽：217

加密語句表情發布：2025-03-12 13:17:36 瀏覽：819

電腦伺服器響應不了發布：2025-03-12 13:16:02 瀏覽：895

vmwarenat外網訪問發布：2025-03-12 13:06:31 瀏覽：45

紅魔三哪個安卓系統最穩定發布：2025-03-12 13:01:45 瀏覽：301

arm嵌入式linux系統發布：2025-03-12 13:01:45 瀏覽：490

伺服器組播地址發布：2025-03-12 13:00:55 瀏覽：266

編程課導發布：2025-03-12 12:56:57 瀏覽：446

封印者要什麼配置發布：2025-03-12 12:51:11 瀏覽：784

電腦終端伺服器輻射大發布：2025-03-12 12:36:54 瀏覽：640

java解析xml

與java解析xml相關的資訊