pythonsaxxml解析xml

发布时间: 2023-08-19 14:01:33

‘壹’ python编写一个程序以尝试解析XML/HTML标签.

要给这段文字添加一个 root 标签，然后对里面的 node 进行遍历。root 标签的名字可以任意定（但是必须添加一个），我这里使用的 root 命名，对于其它的名字也一样。如果你是直接读取的 XML 文件，而不是字符串，可以将文件打开，然后把文件句柄传入 ElementTree.parse() 函数，最后对其返回值进行遍历。

fromxml.etreeimportElementTree
parsed=ElementTree.XML('''<root>
<composer>WolfgangAmadeusMozart</composer><author>SamuelBeckett</author><city>London</city>
</root>''')
outstr=[]
fornodeinparsed:
outstr+=['%s:%s'%(node.tag,node.text)]
print(''.join(outstr))

‘贰’ python如何使用sax提取xml配置文件内容

#vim info.xml
<info>
<intro>信息</intro>
<list id='001'>
<head>auto_userone</head>
<name>Jordy</name>
</list>
</info>
#vim infoxmlparser.py
#!/usr/bin/python
#coding=utf-8
#Python Version Python 2.6.5
from xml.sax.handler import ContentHandler
from xml.sax import parse
class HeadlineHandler(ContentHandler):
in_headline=False
def __init__ (self):
ContentHandler.__init__(self)
self.data=[]
self.file=open('info.txt','w')
self.file.writelines('id'+'\t'+'head\n')
self.file.close()
def startElement(self,name,attrs):
if name == 'list':
self.data.append(attrs['id'])
if name == 'head':
self.in_headline=True
def endElement(self,name):
if name == 'list':
self.file=open('info.txt','a')
self.file.writelines(self.data[0]+'\t'+self.data[1]+'\n')
self.file.close()
self.data=[]
if name == 'head':
self.in_headline=False
def characters(self,string):
if self.in_headline:
self.data.append(string)
if __name__=='__main__':
parse('info.xml',HeadlineHandler())

‘叁’ python读取xml文件有哪些方法

1、以下几种方法建议初学者使用：

xml.etree.ElementTree
xml.dom
xml.dom.minidom
xml.dom.pulldom
xml.parsers.expat
其中，第一个模块更加轻便简介，对于简单的xml文档，推荐使用

下面的方法涉及知识比较多，熟练掌握上面方法后可以了解使用：

2、Dom读取

3、Dom4j读取
使用dom4j需要导入相关的jar包

import java.io.File;
import java.util.Iterator;
import java.util.List;

4、JDom读取
使用jdom需要导入相关的jar包

import java.io.FileInputStream;

import java.io.InputStream;

5、Sax读取

6、properties的读取

‘肆’ python怎么解析xml文件

python对XML的解析
常见的XML编程接口有DOM和SAX，这两种接口处理XML文件的方式不同，当然使用场合也不同。
python有三种方法解析XML，SAX，DOM，以及ElementTree:
1.SAX (simple API for XML )
python 标准库包含SAX解析器，SAX用事件驱动模型，通过在解析XML的过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件。
2.DOM(Document Object Model)
将XML数据在内存中解析成一个树，通过对树的操作来操作XML。
3.ElementTree(元素树)
ElementTree就像一个轻量级的DOM，具有方便友好的API。代码可用性好，速度快，消耗内存少。
注：因DOM需要将XML数据映射到内存中的树，一是比较慢，二是比较耗内存，而SAX流式读取XML文件，比较快，占用内存少，但需要用户实现回调函数（handler）。

‘伍’ 初学Python求助Python解析xml

1. 我上面这段xml代码，一开始没有注意看，在每一个元素的结尾元素中都含有转义符，这就是为什么我用xml解析插件时一直保报错的原因，因为他不是正规的xml格式。我的方法是用正则替换掉：re.sub(r'(<)\\(/.+?>)',r'\g<1>\g<2>',f_xml) 对于Python中的正则re的sub用法
2. 处理成正规的xml格式后，我这里还是用ElementTree来解析的，但在加载时又报错：
cElementTree.ParseError: XML or text declaration not at start of entity: line 2, column 0
这个错误我在网上没有找到合适的答案，不过根据字面意思来解决，就是在开头的地方有错误。这里我尝试这吧xml的文档声明给去掉了，居然没有报错。这里有些不理解为什么不能加？我的方法：f_xml=test_xml.replace('<?xml version="1.0" encoding="gbk"?>','')
3. 然后再加载，就能获取到相应的节点了。
主要代码如下：
f_xml=test_xml.replace('<?xml version="1.0" encoding="gbk"?>','')
mat=re.sub(r'(<)\\(/.+?>)',r'\g<1>\g<2>',f_xml)
xml_root_doc=ET.fromstring(f_xml)
print(xml_root_doc)

阅读全文

热点内容

虚拟机sql 发布：2025-03-17 14:53:17 浏览：268

螺纹M30的编程发布：2025-03-17 14:51:00 浏览：138

java出参发布：2025-03-17 14:50:54 浏览：929

安卓b站如何看私信发布：2025-03-17 14:50:48 浏览：810

黑群晖外网访问发布：2025-03-17 14:44:02 浏览：716

孩子学编程要多少钱发布：2025-03-17 14:37:31 浏览：804

java下载网络文件发布：2025-03-17 14:36:50 浏览：63

立体存储仓发布：2025-03-17 14:32:23 浏览：850

钉钉如何缓存发布：2025-03-17 14:28:44 浏览：189

adbandroid源码发布：2025-03-17 14:21:54 浏览：691

pythonsaxxml解析xml

与pythonsaxxml解析xml相关的资讯