gpt4 book ai didi

python - 在 Python 中从 XML 中提取数据

转载 作者:太空宇宙 更新时间:2023-11-03 21:32:40 25 4
gpt4 key购买 nike

我有一个 XML 文件,其中包含来自多个源的数据,我正在尝试提取这些数据进行分析。但我无法提取数据。

有人能告诉我在保留数据标题和单位的同时提取数据的过程吗?

文件已附 xml file

数据快照也附在此处:

enter image description here

我能得到的唯一输出是标题,我无法将数据加载到 python 中进行进一步分析。非常感谢任何帮助。

最佳答案

一个简单的方法是使用 xmltodict :

with open("00001.xml", "r") as file:
raw = file.read()

import xmltodict
data = xmltodict.parse(raw)
print(data)

打印出:

OrderedDict([('logs',
OrderedDict([('@xmlns', 'http://www.witsml.org/schemas/1series'),
('@xmlns:xsi',
'http://www.w3.org/2001/XMLSchema-instance'),
('@version', '1.4.1.1'),
('log',
OrderedDict([('@uidWell', 'W-508420'),
('@uidWellbore', 'B-508420'),
('@uid', 'L-508421-Time'),
('nameWell', '15/9-F-5'),
('nameWellbore',
'15/9-F-5 - Main Wellbore'),
('name', 'Real Time SLB - Time Log'),
('serviceCompany', 'Schlumberger'),
('creationDate',
'2007-12-18T13:28:58.000Z'),

您将获得一个有序字典,您可以像访问任何其他字典值一样访问该值。

如果你想获取表格数据,我建议使用 pandas:

import pandas as pd
df = pd.DataFrame(data["logs"])
df.head()

关于python - 在 Python 中从 XML 中提取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53441436/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com