gpt4 book ai didi

python - 使用 python 解析非常大的 xml 文件时出现问题

转载 作者:行者123 更新时间:2023-11-28 19:34:17 25 4
gpt4 key购买 nike

我有一个很大的 xml 文件(大约 84MB),格式如下:

<books>
<book>...</book>
....
<book>...</book>
</books>

我的目标是提取每一本书并获取其属性。我尝试按如下方式解析它(就像我对其他 xml 文件所做的那样):

from xml.dom.minidom import parse, parseString

fd = "myfile.xml"
parser = parse(fd)
## other python code here

但是代码似乎在解析指令中失败了。为什么会发生这种情况,我该如何解决?

我应该指出,该文件可能包含希腊文、西类牙文和阿拉伯文字符。

这是我在 ipython 中得到的输出:

In [2]: fd = "myfile.xml"

In [3]: parser = parse(fd)
Killed

我想指出的是,计算机在执行过程中死机了,所以这可能与内存消耗有关,如下所述。

最佳答案

试试lxml哪个更容易使用。

#!/usr/bin/env python
from lxml import etree

with open("myfile.xml") as fp:
tree = etree.parse(fp)
root = tree.getroot()

print root.tag

for book in root:
print book.text

关于python - 使用 python 解析非常大的 xml 文件时出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14081701/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com