pythonsaxxml解析xml

發布時間: 2023-08-19 14:01:33

『壹』 python編寫一個程序以嘗試解析XML/HTML標簽.

要給這段文字添加一個 root 標簽，然後對裡面的 node 進行遍歷。root 標簽的名字可以任意定（但是必須添加一個），我這里使用的 root 命名，對於其它的名字也一樣。如果你是直接讀取的 XML 文件，而不是字元串，可以將文件打開，然後把文件句柄傳入 ElementTree.parse() 函數，最後對其返回值進行遍歷。

fromxml.etreeimportElementTree
parsed=ElementTree.XML('''<root>
<composer>WolfgangAmadeusMozart</composer><author>SamuelBeckett</author><city>London</city>
</root>''')
outstr=[]
fornodeinparsed:
outstr+=['%s:%s'%(node.tag,node.text)]
print(''.join(outstr))

『貳』 python如何使用sax提取xml配置文件內容

#vim info.xml
<info>
<intro>信息</intro>
<list id='001'>
<head>auto_userone</head>
<name>Jordy</name>
</list>
</info>
#vim infoxmlparser.py
#!/usr/bin/python
#coding=utf-8
#Python Version Python 2.6.5
from xml.sax.handler import ContentHandler
from xml.sax import parse
class HeadlineHandler(ContentHandler):
in_headline=False
def __init__ (self):
ContentHandler.__init__(self)
self.data=[]
self.file=open('info.txt','w')
self.file.writelines('id'+'\t'+'head\n')
self.file.close()
def startElement(self,name,attrs):
if name == 'list':
self.data.append(attrs['id'])
if name == 'head':
self.in_headline=True
def endElement(self,name):
if name == 'list':
self.file=open('info.txt','a')
self.file.writelines(self.data[0]+'\t'+self.data[1]+'\n')
self.file.close()
self.data=[]
if name == 'head':
self.in_headline=False
def characters(self,string):
if self.in_headline:
self.data.append(string)
if __name__=='__main__':
parse('info.xml',HeadlineHandler())

『叄』 python讀取xml文件有哪些方法

1、以下幾種方法建議初學者使用：

xml.etree.ElementTree
xml.dom
xml.dom.minidom
xml.dom.pulldom
xml.parsers.expat
其中，第一個模塊更加輕便簡介，對於簡單的xml文檔，推薦使用

下面的方法涉及知識比較多，熟練掌握上面方法後可以了解使用：

2、Dom讀取

3、Dom4j讀取
使用dom4j需要導入相關的jar包

import java.io.File;
import java.util.Iterator;
import java.util.List;

4、JDom讀取
使用jdom需要導入相關的jar包

import java.io.FileInputStream;

import java.io.InputStream;

5、Sax讀取

6、properties的讀取

『肆』 python怎麼解析xml文件

python對XML的解析
常見的XML編程介面有DOM和SAX，這兩種介面處理XML文件的方式不同，當然使用場合也不同。
python有三種方法解析XML，SAX，DOM，以及ElementTree:
1.SAX (simple API for XML )
python 標准庫包含SAX解析器，SAX用事件驅動模型，通過在解析XML的過程中觸發一個個的事件並調用用戶定義的回調函數來處理XML文件。
2.DOM(Document Object Model)
將XML數據在內存中解析成一個樹，通過對樹的操作來操作XML。
3.ElementTree(元素樹)
ElementTree就像一個輕量級的DOM，具有方便友好的API。代碼可用性好，速度快，消耗內存少。
註：因DOM需要將XML數據映射到內存中的樹，一是比較慢，二是比較耗內存，而SAX流式讀取XML文件，比較快，佔用內存少，但需要用戶實現回調函數（handler）。

『伍』初學Python求助Python解析xml

1. 我上面這段xml代碼，一開始沒有注意看，在每一個元素的結尾元素中都含有轉義符，這就是為什麼我用xml解析插件時一直保報錯的原因，因為他不是正規的xml格式。我的方法是用正則替換掉：re.sub(r'(<)\\(/.+?>)',r'\g<1>\g<2>',f_xml) 對於Python中的正則re的sub用法
2. 處理成正規的xml格式後，我這里還是用ElementTree來解析的，但在載入時又報錯：
cElementTree.ParseError: XML or text declaration not at start of entity: line 2, column 0
這個錯誤我在網上沒有找到合適的答案，不過根據字面意思來解決，就是在開頭的地方有錯誤。這里我嘗試這吧xml的文檔聲明給去掉了，居然沒有報錯。這里有些不理解為什麼不能加？我的方法：f_xml=test_xml.replace('<?xml version="1.0" encoding="gbk"?>','')
3. 然後再載入，就能獲取到相應的節點了。
主要代碼如下：
f_xml=test_xml.replace('<?xml version="1.0" encoding="gbk"?>','')
mat=re.sub(r'(<)\\(/.+?>)',r'\g<1>\g<2>',f_xml)
xml_root_doc=ET.fromstring(f_xml)
print(xml_root_doc)

閱讀全文

熱點內容

蝸牛游戲安卓手機怎麼更換賬號發布：2025-03-17 13:41:49 瀏覽：321

為什麼人買一個蘋果一個安卓發布：2025-03-17 13:36:59 瀏覽：438

三星手機簡訊在那個文件夾發布：2025-03-17 13:31:51 瀏覽：194

安卓皇帝隱藏劇情在哪裡發布：2025-03-17 13:18:53 瀏覽：507

新版安卓為什麼不兼容發布：2025-03-17 13:18:49 瀏覽：483

s3哪個配置性價比高發布：2025-03-17 13:06:09 瀏覽：320

氣體壓縮能量發布：2025-03-17 13:00:16 瀏覽：78

壓縮油19 發布：2025-03-17 12:25:29 瀏覽：858

linux上網代理發布：2025-03-17 12:23:56 瀏覽：361

c是高級語言嗎發布：2025-03-17 12:16:31 瀏覽：525

pythonsaxxml解析xml

與pythonsaxxml解析xml相關的資訊