當前位置:首頁 » 編程語言 » python解析xml字元串

python解析xml字元串

發布時間: 2022-08-31 05:51:28

A. python dom解析xml

應該是你的XML文件結構有問題。
把<resources>改為:

<resources xmlns:android="http://schemas.android.com/apk/res/android"
xmlns:xliff="urn:oasis:names:tc:xliff:document:1.2">

B. PYTHON腳本解析XML文件的問題

對於python來說,它只是列印了一些字元串而已,和列印hello world之類的字元串沒有任何區別。html結構對瀏覽器來說才是有用和必須的,body標簽最後才結束,是因為中間要輸出body的內容啊,一個論壇主頁面不能body是空的啊。
你明白了嗎?

C. python怎麼讀取xml

引入XML組件:import xml.dom.minidom。
創建一個xml文件,<?xml version="1.0" encoding="utf-8"?>。
相關推薦:《Python教程》
載入讀取XML文件,xml.dom.minidom.parse('abc.xml'),這是xml文件的對象。
獲取XML文檔對象,root = dom.documentElement。
獲取標簽之間的數據 ,rootdata.getElementsByTagName('caption')。
總結一下xml對象,node.getAttribute(AttributeName),獲取XML節點屬性值,node.getElementsByTagName(TagName),獲取XML節點對象集合,等等具體的查看手冊。

D. Python get返回xml解析問題

你這貼的代碼格式都不調一下,看的好痛苦。。。。。

另:貼一份我早期寫的一個解析xml轉換為字典的代碼,支持中文

細微部分,你自己調

importxml.etree.ElementTreeasET
importos
'''
將指定目錄下的xml文件轉換為字典dict
strXmlFileName:xml文件name
strElementPath:xml節點
dictSubElement:dict用於返回
eg.my_dict=xml2dict('xxx.xml','node',my_dict)
'''
defxml2dict(strXmlFileName,strElementPath,dictSubElement):
elementList=[]
dictSubElement.clear()
try:
eTree=ET.parse(os.getcwd()+strXmlFileName)
exceptException,errorinfo:
print"xml2dict:ET.parse(%s)generateexception,errorinfo:%s"%((os.getcwd()+strXmlFileName),errorinfo)
raiseerrorinfo

try:
elementList=eTree.findall(strElementPath)
exceptException,errorinfo:
print"xml2dict:eTree.findall(%s)generateexception,errorinfo:%s"%(strElementPath,errorinfo)
raiseerrorinfo

pathList=[]
forelementinelementList:
forsubelementinelement.getchildren():
#print"tag:%s,text:%s"%(subelement.tag,subelement.text.encode("utf-8"))
ifsubelement.textisnotNone:
ifsubelement.taginpathList:
dictSubElement[subelement.tag]=(os.getcwd()+subelement.text).encode('utf-8')
else:
dictSubElement[subelement.tag]=subelement.text.encode('utf-8')
else:
dictSubElement[subelement.tag]=""#將None賦值一串空字元串

E. 用python解析XML格式的字元串

你這樣的數據還沒有用正則來的簡單
r'(?<=\<Result\>)(.+?)(?=\</Result\>)'

用XML會比較麻煩:
dom1 = minidom.parseString(xml)
result = dom1.getElementsByTagName("Result")
result = result[0].childNodes[0].nodeValue

F. python如何解析xml格式的字元串,最好解析成鍵值對的那種,

有現成的庫可以用,xml.etree.ElementTree,或者xml.dom.minidom,ET相對來說簡單一些,而minidom配上node緩存也是一種不錯的實現,原理都一樣,就是把xml先轉化為dom樹。這兩個庫可以參考官方文檔,xml以及dom樹可以參考w3school

G. Python 怎麼解析 xml字元串

1. 我上面這段xml代碼,一開始沒有注意看,在每一個元素的結尾元素中都含有轉義符,這就是為什麼我用xml解析插件時一直保報錯的原因,因為他不是正規的xml格式。我的方法是用正則替換掉:re.sub(r'(<)\\(/.+?>)',r'\g<1>\g<2>',f_xml) 對於Python中的正則re的sub用法
2. 處理成正規的xml格式後,我這里還是用ElementTree來解析的,但在載入時又報錯:
cElementTree.ParseError: XML or text declaration not at start of entity: line 2, column 0
這個錯誤我在網上沒有找到合適的答案,不過根據字面意思來解決,就是在開頭的地方有錯誤。這里我嘗試這吧xml的文檔聲明給去掉了,居然沒有報錯。這里有些不理解為什麼不能加? 我的方法:f_xml=test_xml.replace('<?xml version="1.0" encoding="gbk"?>','')
3. 然後再載入,就能獲取到相應的節點了。

H. Python編寫一個程序以嘗試解析XML/HTML標簽.

要給這段文字添加一個 root 標簽,然後對裡面的 node 進行遍歷。root 標簽的名字可以任意定(但是必須添加一個),我這里使用的 root 命名,對於其它的名字也一樣。如果你是直接讀取的 XML 文件,而不是字元串,可以將文件打開,然後把文件句柄傳入 ElementTree.parse() 函數,最後對其返回值進行遍歷。


fromxml.etreeimportElementTree
parsed=ElementTree.XML('''<root>
<composer>WolfgangAmadeusMozart</composer><author>SamuelBeckett</author><city>London</city>
</root>''')
outstr=[]
fornodeinparsed:
outstr+=['%s:%s'%(node.tag,node.text)]
print(''.join(outstr))

I. 怎樣優雅解決 python 解析 xml gb2312 編碼的問題

python ElementTree處理gbk(或者gb2312)編碼的XML文件的方法:
1,py文件的編碼是utf-8,即在文件最開始有如下語句聲明編碼方式:
#-*-coding: utf-8-*-

2,讀取文件內容時轉碼為utf-8的:
xml_file_text = open(xml_file_name).read().decode('gbk').encode('utf-8')
這樣在處理過程中均是utf-8編碼的字元串

熱點內容
如何登錄男朋友的微信密碼 發布:2025-01-16 07:41:14 瀏覽:193
寶駿解壓流程 發布:2025-01-16 07:35:35 瀏覽:1
兩匹壓縮機多少錢 發布:2025-01-16 07:29:19 瀏覽:634
個人pc搭建游戲伺服器 發布:2025-01-16 07:27:09 瀏覽:970
存儲剩餘照片 發布:2025-01-16 07:25:01 瀏覽:49
ftp解除限制上傳文件個數 發布:2025-01-16 07:16:26 瀏覽:347
梯度下降法python 發布:2025-01-16 07:10:43 瀏覽:520
載入並編譯著色器apex 發布:2025-01-16 07:00:08 瀏覽:59
方舟出售腳本 發布:2025-01-16 06:57:55 瀏覽:955
釘釘代理伺服器Ip地址和瑞口 發布:2025-01-16 06:57:05 瀏覽:698