gpt4 book ai didi

python - 如何使用 lxml 从 KML 获取元素值

转载 作者:太空宇宙 更新时间:2023-11-03 21:03:16 25 4
gpt4 key购买 nike

我的问题与此处发现的问题非常相似:

How to pull data from KML/XML?

上述问题的答案是使用Nokogiri来修复格式。

我想知道是否有一种方法可以在不先修复格式的情况下解决类似的问题。

如何获取字典的值,以便我可以从下面的 Element SimpleData 获取“FM2”和“FM3”?

这是我的 KML:

<?xml version="1.0" encoding="UTF-8"?>
<kml xmlns="http://www.opengis.net/kml/2.2" xmlns:gx="http://www.google.com/kml/ext/2.2" xmlns:kml="http://www.opengis.net/kml/2.2" xmlns:atom="http://www.w3.org/2005/Atom">
<Document>
<name>Test.kml</name>
<open>1</open>
<Schema name="test" id="S_test_SSSSSIIIDSDDDDDISSSDSSSDD">
<SimpleField type="string" name="ID"> <displayName>&lt;b&gt;ID&lt;/b&gt;</displayName>
</SimpleField>
<SimpleField type="string" name="cname"><displayName>&lt;b&gt;cname&lt;/b&gt;</displayName>
</SimpleField>
</Schema>
<Style id="falseColor01">
<BalloonStyle>
<text><![CDATA[<table border="0"><tr>
<td>b>ID</b>/td>td>$[test/ID]</td></tr>
<tr><td><b>cname</b></td><td>$[test/cname]</td></tr>
</table>]]></text>
</BalloonStyle>
<LineStyle>
<color>ffffff00</color>
<width>3</width>
</LineStyle>
<PolyStyle>
<color>ffffff00</color>
<colorMode>random</colorMode>
<fill>0</fill>
</PolyStyle>
</Style>
<StyleMap id="falseColor0">
<Pair>
<key>normal</key>
<styleUrl>#falseColor00</styleUrl>
</Pair>
<Pair>
<key>highlight</key>
<styleUrl>#falseColor01</styleUrl>
</Pair>
</StyleMap>
<Style id="falseColor00">
<BalloonStyle>
</BalloonStyle>
<LineStyle>
<color>ffffff00</color>
<width>3</width>
</LineStyle>
<PolyStyle>
<color>ffffff00</color>
<colorMode>random</colorMode>
<fill>0</fill>
</PolyStyle>
</Style>
<Folder id="layer 0">
<name>Test_1</name>
<open>1</open>
<Placemark>
<styleUrl>#falseColor0</styleUrl>
<ExtendedData>
<SchemaData schemaUrl="#S_test_SSSSSIIIDSDDDDDISSSDSSSDD">
<SimpleData name="ID">FM2</SimpleData>
<SimpleData name="cname">FM2</SimpleData>
</SchemaData>
</ExtendedData>
<Polygon>
<outerBoundaryIs>
<LinearRing>
<coordinates>150.889999,-32.17281600000001,0
</coordinates>
</LinearRing>
</outerBoundaryIs>
</Polygon>
</Placemark>
<Placemark>
<styleUrl>#falseColor0</styleUrl>
<ExtendedData>
<SchemaData schemaUrl="#S_test_SSSSSIIIDSDDDDDISSSDSSSDD">
<SimpleData name="ID">FM3</SimpleData>
<SimpleData name="cname">FM3</SimpleData>
</SchemaData>
</ExtendedData>
<Polygon>
<outerBoundaryIs>
<LinearRing>
<coordinates>150.90104,-32.15662800000001,0
</coordinates>
</LinearRing>
</outerBoundaryIs>
</Polygon>
</Placemark>
</Folder>
</Document>
</kml>

我的目标是从元素“ID”中获取元素值,即“FM2”。

我正在尝试使用 lxml etree。我的代码是:

tree  = ET.parse(kml_file)
root = tree.getroot()

for Document in root:
for Folder in Document:
for Placemark in Folder:
for ExtendedData in Placemark:
for SchemaData in ExtendedData:
for SimpleData in SchemaData:
print(SimpleData.attrib)

输出为:{'名称':'ID'}{'name': 'cname'}

如何获取字典的值,以便获得“FM2”和“FM3”?

我花了几个小时试图解决这个问题。任何帮助将不胜感激。

最佳答案

您遇到的问题之一是,当您执行 for x in y 时,您正在迭代当前元素的所有子元素。

所以当你这样做时:

for Folder in Document:
...

您不只是迭代 Folder 元素;您还可以迭代 nameopenSchemaStyleStyleMap >(暂时排除命名空间)。

您仍然可以通过测试 name 属性值然后返回元素文本来获得您想要的内容...

for Document in root:
for Folder in Document:
for Placemark in Folder:
for ExtendedData in Placemark:
for SchemaData in ExtendedData:
for SimpleData in SchemaData:
if SimpleData.get("name") == "ID":
print(SimpleData.text)

但我不推荐它。

请考虑使用 XPath 1.0与lxml的xpath()功能。

这将允许您直接定位您感兴趣的元素。

对于此示例,我将使用完整路径而不是 // abbreviated syntax 。我还将使用 predicate测试属性值。

乍一看,您可能会认为 name 属性值为“ID”的所有 SimpleData 元素的 XPath 为:

/kml/Document/Folder/Placemark/ExtendedData/SchemaData/SimpleData[@name='ID']

但事实并非如此。如果您注意到根 (kml) 元素上有一个 xmlns="http://www.opengis.net/kml/2.2"。这意味着该元素及其所有后代元素都位于默认命名空间 http://www.opengis.net/kml/2.2 中(除非在这些元素上另外声明)。

举例来说,如果您将 print(f"In Folder element\"{Folder.tag}\"...") 添加到您的 for 文档中的文件夹 循环,你会看到:

In Folder element "{http://www.opengis.net/kml/2.2}name"...
In Folder element "{http://www.opengis.net/kml/2.2}open"...
In Folder element "{http://www.opengis.net/kml/2.2}Schema"...
In Folder element "{http://www.opengis.net/kml/2.2}Style"...
In Folder element "{http://www.opengis.net/kml/2.2}StyleMap"...
In Folder element "{http://www.opengis.net/kml/2.2}Style"...
In Folder element "{http://www.opengis.net/kml/2.2}Folder"...

有几种方法可以处理 namespaces in lxml ,但我更喜欢在字典中声明它们并使用 namespaces 参数传递它们。

这是一个完整的示例...

from lxml import etree

ns = {"kml": "http://www.opengis.net/kml/2.2"}

tree = etree.parse("test.kml")

for simple_data in tree.xpath("/kml:kml/kml:Document/kml:Folder/kml:Placemark/kml:ExtendedData/kml:SchemaData/kml:SimpleData[@name='ID']", namespaces=ns):
print(simple_data.text)

打印输出...

FM2
FM3

关于python - 如何使用 lxml 从 KML 获取元素值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55586376/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com