python - 无法在python中将xml文件转换为csv-6ren

python - 无法在python中将xml文件转换为csv

转载作者：行者123 更新时间：2023-12-01 09:05:59

25

4

为了使用 tensorflow 检测 API，我需要将 xml 文件转换为 csv 标签。我使用了这段代码，取自 datitran 的浣熊检测模型。他的github上有这个，你试试吧。 https://github.com/datitran/raccoon_dataset

但是，当我使用他的 xml_to_csv 代码时，我可以编译它，但新的标签文件是空的。这是代码，

import os
import glob
import pandas as pd
import xml.etree.ElementTree as ET


def xml_to_csv(path):
xml_list = []
for xml_file in glob.glob(path + '/*.xml'):
    tree = ET.parse(xml_file)
    root = tree.getroot()
    for member in root.findall('object'):
        value = (root.find('filename').text,
                 int(root.find('size')[0].text),
                 int(root.find('size')[1].text),
                 member[0].text,
                 int(member[4][0].text),
                 int(member[4][1].text),
                 int(member[4][2].text),
                 int(member[4][3].text)
                 )
        xml_list.append(value)
column_name = ['filename', 'width', 'height', 'class', 'xmin', 'ymin', 'xmax', 'ymax']
xml_df = pd.DataFrame(xml_list, columns=column_name)
return xml_df


def main():
for directory in ['train','test']:
    image_path = os.path.join(os.getcwd(), 'images/{}'.format(directory))
    xml_df = xml_to_csv(image_path)
    xml_df.to_csv('data/{}_labels.csv'.format(directory), index=None)
    print('Successfully converted xml to csv.')


main()

其中“train”和“test”是包含 xml 文件的文件夹，images 是包含它们的文件夹，data 是我希望保存标签文件的文件夹。

最佳答案

我已使用上面给出的链接下载 github 存储库并查看了代码。首先，我复制上面的代码并粘贴到一个新文件中并运行它。

在上面发布的代码中，您获得空文件的原因是您为要调用的方法设置的路径在存储库中不存在，

如果我假设您想要使用 annotations 文件夹中提供的 xml 文件来创建新的 csv 文件来包含测试和单独训练数据，您所要做的就是在 Images 目录中创建两个名为 test 和 train 的新目录，然后复制 >xml 文件从 annotations 到您创建的这些新目录，然后运行上面的代码，它就可以完美运行

我只是做了同样的事情，只从 annotations 目录复制了一些 xml 文件当我这样做时，打印数据框以显示

 F:\expts\raccoon_dataset-master\raccoon_dataset-master>python import.py
          filename  width  height    class  xmin  ymin  xmax  ymax
0    raccoon-1.png    650     417  raccoon    81    88   522   408
1   raccoon-10.png    450     495  raccoon   130     2   446   488
2   raccoon-11.png    660     432  raccoon     3     1   461   431
3   raccoon-12.png    259     194  raccoon    28    21   126   181
4   raccoon-12.png    259     194  raccoon    85    33   235   193
5   raccoon-13.png    660     495  raccoon    55    28   393   313
6   raccoon-14.png    900     484  raccoon   163    81   546   438
7   raccoon-15.png    640     360  raccoon   313    61   614   360
8    raccoon-2.png    800     573  raccoon    60    51   462   499
9    raccoon-3.png    720     480  raccoon     1     1   720   476
10   raccoon-4.png    275     183  raccoon    21    11   200   183
11   raccoon-5.png    270     187  raccoon     3     3   260   179
12   raccoon-6.png    480     360  raccoon     1    44   307   316
13   raccoon-7.png    410     308  raccoon    92    79   271   264
14   raccoon-8.png    259     194  raccoon    16    11   236   175
15   raccoon-9.png    347     510  raccoon    10     7   347   471
Successfully converted xml to csv.
         filename  width  height    class  xmin  ymin  xmax  ymax
0  raccoon-16.png    424     640  raccoon    51   178   355   632
1  raccoon-17.png    259     194  raccoon    95    60   167   118
2  raccoon-18.png    240     156  raccoon    32    25   201   130
3  raccoon-19.png    259     194  raccoon    87     8   182    89
4  raccoon-20.png    720     540  raccoon     2    29   720   503
5  raccoon-21.png    290     174  raccoon    59     2   216   171
6  raccoon-22.png    640     360  raccoon   252    76   466   335
7  raccoon-23.png    259     194  raccoon   108     1   258   194
8  raccoon-24.png    268     188  raccoon    77    48   179   156
9  raccoon-24.png    268     188  raccoon   139    77   202   145
Successfully converted xml to csv.

希望这有帮助

关于python - 无法在python中将xml文件转换为csv，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52047920/

25

4

0

文章推荐： python - 如何记录作为函数的参数字符串

文章推荐： java - 如何在向下滚动时固定标题位置

xml - 如何在没有源 xml 文件根节点的情况下将一个 xml 文件包含在另一个 xml 中？
正如标题中所问，我有两个如下结构的 XML 文件 A.xml //here I want to include B.xml
c# - 如何将等 xml 标签格式更改为
我有一个 xml 文件。根据我的要求，我需要更新空标签，例如我需要更改 to .是否可以像那样更改标签.. 谢谢... 最佳答案 var xmlString=" "; var properStri
xml - Golang : get inner xml from xml with xml.解码
我有这样简单的 XML: Song Playing 09:41:18 Frederic Delius Violin Son
xml - XML 阅读器是否应该忽略 XML 文件中的连续空格？
在我的工作中，我们有自己的 XML 类来构建 DOM，但我不确定应该如何处理连续的空格？例如 Hello World 当它被读入 DOM 时，文本节点应该包含 Hello 和 World
xml - 比较来自不同 XML 文件的元素值并附加到第一个 XML
我有以下 2 个 xml 文件，我必须通过比较 wd:Task_Name_ID 和 TaskID 的 XML 文件 2。例如，Main XML File-1 wd:Task_Name_ID 具有以下
xml - 使 XML 构建器从字符串中插入 XML
我在 Rails 应用程序中有一个 XML View ，需要从另一个文件插入 XML 以进行测试。我想说“构建器，只需盲目地填充这个字符串，因为它已经是 xml”，但我在文档中看不到这样做的任何内容
xml - XML 数据和 XML 元数据之间有什么区别？
我正在重建一些 XML 提要，因此我正在研究何时使用元素以及何时使用带有 XML 的属性。一些网站说“数据在元素中，元数据在属性中。” 那么，两者有什么区别呢？让我们以 W3Schools 为例:
xml - 文档中的多个 XML 声明是否为格式正确的 XML？
在同一个文档中有两个 XML 声明是否是格式正确的 XML？ hello 我相信不是，但是我找不到支持我的消息来源。来自 Extensible Markup Language
xml - 在 XML 中包装任意 XML
我需要在包装器 XML 文档中嵌入任意(语法上有效的)XML 文档。嵌入式文档被视为纯文本，在解析包装文档时不需要可解析。我知道“CDATA trick”，但如果内部 XML 文档本身包含 CDAT
xml - XML 解析器和 XML 处理器是否相同？
XML 解析器和 XML 处理器是两个不同的东西吗？他们是两个不同的工作吗？最佳答案 XML 解析器和 XML 处理器是一样的。它不适用于其他语言。 XML 是通用数据标记语言。解析 XML 文件已
xml - 在保留格式的同时从文件读取 XML 和从文件读取 XML
我使用这个 perl 代码从一个文件中读取 XML，然后写入另一个文件(我的完整脚本有添加属性的代码): #!usr/bin/perl -w use strict; use XML::DOM; use
xml - 使用 PowerShell 将 system.xml.xml 元素转换为 system.xml.xml 文档
我正在编写一个我了解有限的历史脚本。对象 A 的类型为 system.xml.xmlelement，我需要将其转换为类型 system.xml.xmldocument 以与对象 B 进行比较(类型
xml - 如何将子节点结构从一个 XML 文件复制到另一个 XML 文件(合并两个 XML 文件)？
我有以下两个 XML 文件: 文件1 101 102 103 501 502 503
xml - 如何将子节点结构从一个 XML 文件复制到另一个 XML 文件(合并两个 XML 文件)？
我有以下两个 XML 文件: 文件1 101 102 103 501 502 503
java - 转换性能 XML>XSL>XML 与 XML>JAXB>XML
我有一个案例，其中一个 xml 作为输入，另一个 xml 作为输出:我可以选择使用 XSL 和通过 JAXB 进行 Unmarshalling 编码。性能方面，有什么真正的区别吗？最佳答案首先，程
java - 从 XML 元素获取 XML 时的标签顺序(XML 包含 XML)？
我有包含 XML 的 XML，我想使用 JAXB 解析它 qwqweqwezxcasdasd eee 解析器 public static NotificationRequest parse(Strin
xml - 无法使用 XML 架构和 Perl (XML::LibXML) 验证 XML
xml: mario de2f15d014d40b93578d255e6221fd60 Mario F 23 maria maria
java.net.MalformedURLException : no protocol: [c:\XML\file. xml，c :\XML\file2. xml，c :\XML\file3. xml]
尝试更新 xml 文件数组时出现以下错误。代码片段: File dir = new File("c:\\XML"); File[] files = dir.listFiles(new Filenam
xml - 如何使用 ConvertTo-Xml 和 Select-Xml 加载或读取 XML 文件？
我怎样才能完成这样的事情: PS /home/nicholas/powershell> PS /home/nicholas/powershell> $date=(Get-Date | ConvertT
xml - 删除 XML 节点以将 XML 日志文件的大小减小到给定大小
我在从 xml 文件中删除节点时遇到一些困难。我发现很多其他人通过各种方式在 powershell 中执行此操作的示例，下面的代码似乎与我见过的许多其他示例相同，但我没有得到所需的行为。我的目标是将

首页

博学

6Ren·AI

商城

python - 无法在python中将xml文件转换为csv