python解析XML
首先我是用的是dom去解析我们xml文件。
一、读取XML文件
DOM 方式:DOM 中文译为文档对象模型,是 W3C 组织推荐的标准编程接口,它将 XML 数据在内存中解析成一个树,通过对树的操作来操作 XML
首先我们的一个xml的文本是:
<?xml version="1.0" encoding="utf-8"?>
<catalog>
<login username="pytest" passwd="123456">
<caption>Python</caption>
<item id="4">
<caption>测试</caption>
</item>
</login>
</catalog>
python代码:注意 xml.dom.minidom 模块是python自带的模块,不需要自行下载,直接用就行了
from xml.dom.minidom import xml
# 读取文件
dom = xml.dom.minidom.parse('test.xml')
# 获取XML文档对象
rootdata = dom.documentElement
# 获取标签之间的数据
itemlist = rootdata.getElementsByTagName('caption')
# 获取标签属性值 我们 caption
caption = itemlist[0].firstChild.data
print(caption)
结果是:
那么如果我们取值列表里面的是【1】是:
caption = itemlist[1].firstChild.data
print(caption)
结果是:
我们要是想读取:“<login username="pytest" passwd="123456">”
的数据:那么即是:
# 读取文件
dom = xml.dom.minidom.parse('test.xml')
# 获取XML文档对象
rootdata = dom.documentElement
# 获取标签之间的数据
itemlist = rootdata.getElementsByTagName('login')
# 获取标签属性值
login = itemlist [0].getAttribute('username')
pwd = itemlist [0].getAttribute('passwd')
print(login, s)
结果是:
如果我想遍历caption下面的数据:
# 读取文件
dom = xml.dom.minidom.parse('test.xml')
# 获取XML文档对象
rootdata = dom.documentElement
# 获取标签之间的数据
itemlist = rootdata.getElementsByTagName('caption')
# 遍历标签 caption 的数据
for i in range(len(itemlist)):
print("itemlist[i]:", type(itemlist[i]))
print(itemlist[i].firstChild.data)
结果是: