gpt4 book ai didi

python - 使用 Python 从 XML 文件中提取元素

转载 作者:行者123 更新时间:2023-11-28 23:01:50 25 4
gpt4 key购买 nike

下面的链接为我们提供了食谱列表中的成分列表。我想提取成分的名称并使用 python 将其保存到另一个文件中。 http://stream.massey.ac.nz/file.php/6087/Eva_Material/Tutorials/recipebook.xml

到目前为止,我已经尝试使用以下代码,但它给了我完整的配方,而不是成分的名称:

from xml.sax.handler import ContentHandler
import xml.sax
import sys
def recipeBook():
path = "C:\Users\user\Desktop"
basename = "recipebook.xml"
filename = path+"\\"+basename
file=open(filename,"rt")
# find contents
contents = file.read()

class textHandler(ContentHandler):
def characters(self, ch):
sys.stdout.write(ch.encode("Latin-1"))
parser = xml.sax.make_parser()
handler = textHandler( )
parser.setContentHandler(handler)
parser.parse("C:\Users\user\Desktop\\recipebook.xml")



file.close()

如何提取每种成分的名称并将它们保存到另一个文件?

最佳答案

@内哈

我想您现在已经解决了您的请求,这是我使用 http://lxml.de/tutorial.html 上的教程整理的一小部分内容. XML 文件保存在“rough_data.xml”中

import xml.etree.cElementTree as etree

xmlDoc = open('rough_data.xml', 'r')
xmlDocData = xmlDoc.read()
xmlDocTree = etree.XML(xmlDocData)

for ingredient in xmlDocTree.iter('ingredient'):
print ingredient[0].text

所有阅读本文的有经验的 Python 程序员,请改进这个“新手”代码。

注意:lxml包看起来很不错,绝对值得一用。谢谢

关于python - 使用 Python 从 XML 文件中提取元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10475654/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com