Bootstrap

python解析XML

python解析XML
首先我是用的是dom去解析我们xml文件。
一、读取XML文件
DOM 方式:DOM 中文译为文档对象模型,是 W3C 组织推荐的标准编程接口,它将 XML 数据在内存中解析成一个树,通过对树的操作来操作 XML

首先我们的一个xml的文本是:

<?xml version="1.0" encoding="utf-8"?>
<catalog>
    <login username="pytest" passwd="123456">
        <caption>Python</caption>
        <item id="4">
            <caption>测试</caption>
        </item>
    </login>
</catalog>

python代码:注意 xml.dom.minidom 模块是python自带的模块,不需要自行下载,直接用就行了

from xml.dom.minidom import xml  

# 读取文件
dom = xml.dom.minidom.parse('test.xml')
# 获取XML文档对象
rootdata = dom.documentElement
# 获取标签之间的数据
itemlist = rootdata.getElementsByTagName('caption')
# 获取标签属性值 我们 caption 
caption = itemlist[0].firstChild.data
print(caption)

结果是:
在这里插入图片描述

那么如果我们取值列表里面的是【1】是:

caption = itemlist[1].firstChild.data
print(caption)

结果是:
在这里插入图片描述
我们要是想读取:“<login username="pytest" passwd="123456">” 的数据:那么即是:

# 读取文件
dom = xml.dom.minidom.parse('test.xml')
# 获取XML文档对象
rootdata = dom.documentElement
# 获取标签之间的数据
itemlist = rootdata.getElementsByTagName('login')
# 获取标签属性值
login = itemlist [0].getAttribute('username')
pwd = itemlist [0].getAttribute('passwd')
print(login, s)

结果是:
在这里插入图片描述
如果我想遍历caption下面的数据:

# 读取文件
dom = xml.dom.minidom.parse('test.xml')
# 获取XML文档对象
rootdata = dom.documentElement
# 获取标签之间的数据
itemlist = rootdata.getElementsByTagName('caption')
# 遍历标签 caption 的数据
for i in range(len(itemlist)):
    print("itemlist[i]:", type(itemlist[i]))
    print(itemlist[i].firstChild.data)

结果是:
在这里插入图片描述

;