gpt4 book ai didi

python - 根据 csv 中存储的路径和文本值高效更新 XML 文本内容

转载 作者:太空宇宙 更新时间:2023-11-03 17:35:06 25 4
gpt4 key购买 nike

我有一个 csv 文件 (csvlist.csv),其中包含我需要在第一列中更改的 XML 元素的路径。我需要更改原始节点值的文本在病房的第 2 - 10,000 列中给出。

Path                                                            Edit1       Edit2       Edit3       Edit4       Edit5          ----  Edit1000
".//data/country[@name="Singapore"]/gdpnp[@month="08"]/state", 5.2e-015, 2e-05, 8e-06, 9e-04, 0.4e-05,
".//data/country[@name="Peru"]/gdppc[@month="06"]/region", 0.04, 0.02, 0.15, 3.24, 0.98,

我想根据第 1 列中的路径,用每个后续列中的值和相应的名称替换原始 XML 文件 (NoEdit.xml) 元素的文本,例如基于第 2 列值的 XML 将被命名为 Edit2.xml。

import csv
import xml.etree.ElementTree as ET
tree = ET.parse('NoEdit.xml')
with open('csvlist.csv', 'rb') as csvlist:
reader = csv.reader(csvlist, delimiter=',')
for x in range(1, 1000):
for row in reader:
if reader.line_num == 1: continue # skip the row of headers
for data in tree.findall(row[0]):
data.text = row[(x)]
tree.write('Edit(x).xml')

基于此论坛的帮助q1 q2我已经通过下面的代码做到了这一点。我收到错误:

KeyError: '".//data/country[@name="'

当我给出一个固定路径来消除此错误时,我仍然在 findall 上收到错误,或者我只是没有获得正确的 xml。

如果有任何有关这方面指导的帮助,我将不胜感激。请随意建议执行此操作的替代方法。谢谢

最佳答案

首先,您应该提供一个可重现的示例,以帮助其他用户帮助您。我已经为您完成了一些工作,并创建了一个测试 csv 文件,例如:

Path,                                             Edit1,       Edit2
".//first", 5.2e-015, 2e-05
".//second", 0.04, 0.02

请注意,我在标题中添加了逗号,因为您错过了它们,而且我不知道这是故意的还是输入错误。

我还创建了一个小的 xml 文件:

<root>
<first>1</first>
<second>2</second>
<third>3</third>
</root>

还有脚本:

import csv
from lxml import etree
import sys

xmldata = open(sys.argv[2], newline='').read();

with open(sys.argv[1], newline='') as csvfile:
for i, pivoted_row in enumerate(zip(*csv.reader(csvfile, delimiter=','))):
if i == 0:
xpaths = pivoted_row
continue
pivoted_row = [c.strip() for c in pivoted_row]
tree = etree.fromstring(xmldata)
with open(pivoted_row[0] + ".xml", 'wb') as outfile:
for j in range(1, len(xpaths)):
tree.xpath(xpaths[j])[0].text = pivoted_row[j]
outfile.write(etree.tostring(tree))

关键部分是旋转csv,这样我就可以处理所有数据并一次写入同一个文件。因此,这样第一列(xpaths)将是第一行,所以我将它们保存在一个变量中,该变量遍历每一行。

运行如下:

python3 script.py csvfile xmlfile

它创建两个文件,Edit1.xmlEdit2.xml,其内容如下:

==> Edit1.xml <==
<root>
<first>5.2e-015</first>
<second>0.04</second>
<third>3</third>
</root>
==> Edit2.xml <==
<root>
<first>2e-05</first>
<second>0.02</second>
<third>3</third>
</root>

我希望它有用,并帮助您找到解决问题的好方法。

关于python - 根据 csv 中存储的路径和文本值高效更新 XML 文本内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31308796/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com