python导入xml文件_python爬虫写入excel

python导入xml文件_python爬虫写入excel最近在使用Testlink时,发现导入的用例是xml格式,且没有合适的工具转成excel格式,xml使用excel打开显示的东西也太多,网上也有相关工具转成csv格式的,结果也不合人意。那求人不如尔己,自己写一个吧需要用到的模块有:xml.dom.minidom(python自带)、xlwt使用版本:python:2.7.5xlwt:1.0.0一、先分析TestlinkXML格式:这是一个有两级…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

最近在使用Testlink时,发现导入的用例是xml格式,且没有合适的工具转成excel格式,xml使用excel打开显示的东西也太多,网上也有相关工具转成csv格式的,结果也不合人意。

那求人不如尔己,自己写一个吧

需要用到的模块有:xml.dom.minidom(python自带)、xlwt

使用版本:

python:2.7.5

xlwt:1.0.0

一、先分析Testlink XML格式:

python导入xml文件_python爬虫写入excel

这是一个有两级testusuit的典型的testlink用例结构,我们只需要取testsuite name,testcase name,preconditions,actions,expectedresults

二、程序如下:

#coding:utf-8

”’

Created on 2015-8-20

@author: Administrator

”’

”’

”’

import xml.etree.cElementTree as ET

import xml.dom.minidom as xx

import os,xlwt,datetime

workbook=xlwt.Workbook(encoding=”utf-8″)

#

booksheet=workbook.add_sheet(u’sheet_1′)

booksheet.col(0).width= 5120

booksheet.col(1).width= 5120

booksheet.col(2).width= 5120

booksheet.col(3).width= 5120

booksheet.col(4).width= 5120

booksheet.col(5).width= 5120

dom=xx.parse(r’D:\\Python27\test.xml’)

root = dom.documentElement

row=1

col=1

borders=xlwt.Borders()

borders.left=1

borders.right=1

borders.top=1

borders.bottom=1

style = xlwt.easyxf(‘align: wrap on,vert centre, horiz center’) #自动换行、水平居中、垂直居中

#设置标题的格式,字体方宋、加粗、背景色:菊黄

#测试项的标题

title=xlwt.easyxf(u’font:name 仿宋,height 240 ,colour_index black, bold on, italic off; align: wrap on, vert centre, horiz center;pattern: pattern solid, fore_colour light_orange;’)

item=’测试项’

Subitem=’测试分项’

CaseTitle=’测试用例标题’

Condition=’预置条件’

actions=’操作步骤’

Result=’预期结果’

booksheet.write(0,0,item,title)

booksheet.write(0,1,Subitem,title)

booksheet.write(0,2,CaseTitle,title)

booksheet.write(0,3,Condition,title)

booksheet.write(0,4,actions,title)

booksheet.write(0,5,Result,title)

#冻结首行

booksheet.panes_frozen=True

booksheet.horz_split_pos= 1

#一级目录

for i in root.childNodes:

testsuite=i.getAttribute(‘name’).strip()

#print testsuite

#print testsuite

”’

写测试项

”’

print “row is :”,row

booksheet.write(row,col,testsuite,style)

#二级目录

for dd in i.childNodes:

print ” %s” % dd.getAttribute(‘name’)

testsuite2=dd.getAttribute(‘name’)

if not dd.getElementsByTagName(‘testcase’):

print “Testcase is %s” % testsuite2

row=row+1

booksheet.write(row,2,testsuite2,style) #写测试分项

row=row+1

booksheet.write(row,1,testsuite2,style)

itemlist=dd.getElementsByTagName(‘testcase’)

for subb in itemlist:

#print ” %s” % subb.getAttribute(‘name’)

testcase=subb.getAttribute(‘name’)

row=row+1

booksheet.write(row,2,testcase,style)

ilist=subb.getElementsByTagName(‘preconditions’)

for ii in ilist:

preconditions=ii.firstChild.data.replace(“
“,” “)

col=col+1

booksheet.write(row,3,preconditions,style)

steplist=subb.getElementsByTagName(‘actions’)

#print steplist

for step in steplist:

actions=step.firstChild.data.replace(“
“,” “)

col=col+1

booksheet.write(row,4,actions,style)

#print “测试步骤:”,steplist[0].firstChild.data.replace(“
“,” “)

expectlist=subb.getElementsByTagName(‘expectedresults’)

for expect in expectlist:

result=expect.childNodes[0].nodeValue.replace(“
“,”” )

booksheet.write(row,5,result,style)

row=row+1

workbook.save(‘demo.xls’)

写入excel的效果如下:

python导入xml文件_python爬虫写入excel

我们再来看个实例:

需要下载一个module:xlwt,如下是source code

import xml.dom.minidom

import xlwt

import sys

col = 0

row = 0

def handle_xml_report(xml_report, excel):

problems = xml_report.getElementsByTagName(“problem”)

handle_problems(problems, excel)

def handle_problems(problems, excel):

for problem in problems:

handle_problem(problem, excel)

def handle_problem(problem, excel):

global row

global col

code = problem.getElementsByTagName(“code”)

file = problem.getElementsByTagName(“file”)

line = problem.getElementsByTagName(“line”)

message = problem.getElementsByTagName(“message”)

for node in code:

excel.write(row, col, node.firstChild.data)

col = col + 1

for node in file:

excel.write(row, col, node.firstChild.data)

col = col + 1

for node in line:

excel.write(row, col, node.firstChild.data)

col = col + 1

for node in message:

excel.write(row, col, node.firstChild.data)

col = col + 1

row = row+1

col = 0

if __name__ == ‘__main__’:

if(len(sys.argv) <= 1):

print (“usage: xml2xls src_file [dst_file]”)

exit(0)

#the 1st argument is XML report ; the 2nd is XLS report

if(len(sys.argv) == 2):

xls_report = sys.argv[1][:-3] + ‘xls’

#if there are more than 2 arguments, only the 1st & 2nd make sense

else:

xls_report = sys.argv[2]

xmldoc = xml.dom.minidom.parse(sys.argv[1])

wb = xlwt.Workbook()

ws = wb.add_sheet(‘MOLint’)

ws.write(row, col, ‘Error Code’)

col = col + 1

ws.write(row, col, ‘file’)

col = col + 1

ws.write(row, col, ‘line’)

col = col + 1

ws.write(row, col, ‘Description’)

row = row + 1

col = 0

handle_xml_report(xmldoc, ws)

wb.save(xls_report)

本文标题: Python实现将xml导入至excel

本文地址: http://www.cppcns.com/jiaoben/python/135334.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/171950.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • APP应用平台有哪些?

    APP应用平台有哪些?1、小米应用商店小米开放平台网站:https://account.xiaomi.com注册帐号教程地址:http://dev.xiaomi.com/doc/?p=90应用提交流程:http://dev.xiaomi.com/doc/?p=1292、360手机助手360开放平台地址:http://i.360.cn/注册及应用提交流程教程地址:http:…

  • windows ftp 被动模式_通常ftp用主动还是被动模式

    windows ftp 被动模式_通常ftp用主动还是被动模式环境:windowsserver2012R2FTPclientFileZilla3.7.3windowsserver2012服务器搭建完毕后默认为主动式(测试发现windows10搭建完毕默认为被动式)由于开发人员所做视频推流不支持主动式故需要更改为被动式主动式:有客户端N端口发起连接到服务器端21端口传输数据时由服务器端20端…

  • CC2530: ZigBee协议栈实践例程(一)

    CC2530: ZigBee协议栈实践例程(一)1.ZigBee版本      ZigBee是ZigBee联盟建立的技术标准。第一个ZigBee协议栈规范于2004年发布,称为ZigBee2004或者ZigBee1.0;第二个ZigBee协议栈规范于2006年发布,称为ZigBee2006;第三个ZigBee协议栈规范于2007年发布,称为ZigBee2007;然后呢?现在是2018年了。。。2.Z-Stack版本    …

  • av狼 php,www.ygyyxx.com

    av狼 php,www.ygyyxx.comDomainName:YGYYXX.COMRegistryDomainID:2350998641_DOMAIN_COM-VRSNRegistrarWHOISServer:whois.namesilo.comRegistrarURL:http://www.namesilo.comUpdatedDate:2020-01-08T14:48:59ZCreationDate:20…

  • 无语的准备关时_紧要关头

    无语的准备关时_紧要关头,却不能吹尽弯月沉没的忧伤。我,或许就是忘忧河上撑篙的船夫,孤舟、蓑衣、斗笠,在红尘中摆渡。拾一抹花瓣,从此潇湘谢却,钟声不继。可能真的是前生种下的孽缘,这一生,我们才会狭路相逢,然后,你悄悄偷走我的真爱难找。藕断何必丝连、情断何必怀念,当你离开我的瞬间我才知道你并没有那么的好。藕断何必丝连、情断何必怀念,当你离开我的瞬间我才知道良友虽多,但知己难寻。藕断何必丝连、情断何必怀念,当你离开我的瞬间你

    2022年10月24日
  • 计算机组成原理 寻址方式_计算机组成原理寻址方式的判断

    计算机组成原理 寻址方式_计算机组成原理寻址方式的判断一、寻址方式是指确定本条指令的数据地址以及下一条将要执行的指令地址的方法,与硬件结构紧密相关,而且直接影响指令格式和指令功能。分为指令寻址和数据寻址两大类。二、指令寻址分为顺序寻址和跳跃寻址两种。顺序寻址可通过程序计数器PC加1,自动形成下一条指令的地址;跳跃寻址则通过转移类指令实现。数据寻址种类较多,在指令字中必须设一字段来指明属于哪一种寻址方式。指令的地址码字段通常都不代表操作数的真实地址,把它称为真实地址,记作A。操作数的真实地址成为有效地址,记作EA,它是由寻址方式和形式地址共同来确定的。由

    2022年10月24日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号