Python实现提取XML内容并保存到Excel中的方法-创新互联
本文实例讲述了Python实现提取XML内容并保存到Excel中的方法。分享给大家供大家参考,具体如下:

最近做一个项目是解析XML文件,提取其中的chatid和lt、timestamp等信息,存到excel里。
1.解析xml,提取数据
使用python自带的xml.dom中的minidom(也可以用lxml)
xml文件如下:

minidom.parse()#解析文件,返回DOM对象
_get_documentElement()DOM是树形结构,获得了树形结构的根节点
getElementsByTagName()根据name查找根目录下的子节点
getAttribute()获取DOM节点的属性的值
提取的代码如下:
class get_xml():
#加载获取xml的文档对象
def __init__(self,address):
#解析address文件,返回DOM对象,address为文件地址
self.doc = minidom.parse(address)
#DOM是树形结构,_get_documentElement()获得了树形结构的根节点
self.root = self.doc._get_documentElement()
#.getElementsByTagName(),根据name查找根目录下的子节点
self.httpSample_nodes = self.root.getElementsByTagName('httpSample')
def getxmldata(self):
data_list=[]
j = -1
responseData_node = self.root.getElementsByTagName("responseData")
for i in self.httpSample_nodes:
j = j+1
#getAttribute(),获取DOM节点的属性的值
if i.getAttribute("lb") == "发送信息":
a = 'chatId":"(.*?)"'
elif i.getAttribute("lb") == "接收信息":
# a = "chatId%3A%22(.*?)%22"
a = "info%3A%22(.*?)%22"
if (i.getAttribute("lb") == "发送信息" or i.getAttribute("lb") == "接收信息") and i.getAttribute("rc") == "200":
try:
#使用re包里面的方法,通过正则表达式提取数据
b = re.search(a, responseData_node[j].firstChild.data)
if b is not None:
d = b.group(1)
print("d:",d)
data_list.append((d, i.getAttribute("ts"), i.getAttribute("lt"),i.getAttribute("lb")))
except:
pass
return data_list
当前题目:Python实现提取XML内容并保存到Excel中的方法-创新互联
分享网址:http://www.jxjierui.cn/article/dsidsg.html


咨询
建站咨询
