gpt4 book ai didi

python - 从xml文档中提取元素属性和值而不在python中指定元素

转载 作者:太空宇宙 更新时间:2023-11-04 04:23:22 25 4
gpt4 key购买 nike

我创建了 10 个不同类型的 xml 文档,例如一个包含书籍详细信息,另一个包含电影详细信息或新闻标题等。其中一个 xml 文档是 books.xml,如下所示:

<bookstore>
<book category="COOKING">
<title lang="english">Everyday Italian</title>
<author>Giada De Laurentiis</author>
<year>2005</year>
<price>200.00</price>
</book>

<book category="CHILDREN">
<title lang="english">Harry Potter</title>
<author>J K. Rowling </author>
<year>2005</year>
<price>625.00</price>
</book>
</bookstore>

我想通过在所有 10 个 xml 文档中搜索用户输入的单词来计算单词数。这些词只不过是具有属性及其各自值的元素。

例如:用户输入类别

从上面的例子可以看出category是一个属性并且被写了两次。因此,根据此输出应为“2”,如果该词类别存在于其他 9 个文档中,则计数会相应升级。如何在不指定元素名称的情况下对单个文档执行此操作。它基本上是 xml 解析,那么我该怎么做呢?这对我来说是新的,我面临着一些问题。

/////////////////////////////////////////////////////////////////////////////////////////////////

如果我想使用简单的doc而不是schema怎么办?这与xml解析有关,你能告诉我如何在dom模型对象中使用nodelist对象吗?

请帮忙。

最佳答案

如果您将拥有大量此类 XML 文档,您可以执行以下步骤

  1. 删除属性中的数据。更改文档格式

    <book>
    <category>CHILDREN</category>
    <lang>english</lang>
    <title>Harry Potter</title>
    <author>J K. Rowling </author>
    <year>2005</year>
    <price>625.00</price>
    </book>
  2. 使用Sphinx使用 xmlpipe data source 索引文档

关于python - 从xml文档中提取元素属性和值而不在python中指定元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11281220/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com