gpt4 book ai didi

python-3.x - lxml xmlsyntaxerror : entity 'ouml' not defined

转载 作者:行者123 更新时间:2023-12-05 07:45:48 26 4
gpt4 key购买 nike

我正在使用 lxml 和 python 3.5 来解析 xml 文件。

到目前为止我的代码是:

for event, element in etree.iterparse(source, tag="article"):
for child in element:
print (child.tag, child.text)
element.clear()

执行时,我在一段时间后收到以下消息:

 lxml.etree.XMLSyntaxError: Entity 'ouml' not defined, line 47, column 25

我有一个定义了所有实体的 DTD 文件。如何包含文件或定义缺失的实体?

最佳答案

这是我的解决方案:我正在阅读 DTD 文件以按照 CoderBC 的建议进行验证:

from lxml import etree
from lxml.etree import XMLSyntaxError
import sys
import os

source = sys.argv[1]
dtd = etree.DTD(file=sys.argv[2])#read DTD
count = 0
#iterate through nodes
for event, element in etree.iterparse(source, load_dtd=True):
count += 1
#print all children
for child in element:
print(child.tag, child.text)
element.clear()

print("Final Count :", count)

关于python-3.x - lxml xmlsyntaxerror : entity 'ouml' not defined,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41287976/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com