gpt4 book ai didi

python - Spark XML - 使用 Excel 中的 XML

转载 作者:行者123 更新时间:2023-12-04 20:24:53 26 4
gpt4 key购买 nike

我有一个 Excel 表,其中一列有 XML(每一行都是不同的 xml)。我正在尝试使用 Pyspark 和 spark-xml 来解析这些,通过执行 df = spark.read.format('xml').options(rowTag = 'book').load(___) .
load当您指定一个 xml 文件时工作正常,但是是否可以在 Excel 工作表中读取并循环这些要解析的 xml,而无需将每个文件转换为自己的 xml 文件?

最佳答案

您需要首先将 Excel 文件作为 Spark DataFrame 读取。然后您可以使用 from_xml 进一步解析包含 XML 的字符串列。功能。这提供了一个新列,其中包含来自 XML 列的解析数据。

关于python - Spark XML - 使用 Excel 中的 XML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62388441/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com