gpt4 book ai didi

xml - 使用 Hive XML SerDe 将 XML 解析为多个表

转载 作者:可可西里 更新时间:2023-11-01 15:48:41 25 4
gpt4 key购买 nike

我有一堆要插入到 Hive 中的结构化 XML 文件。结构看起来有点像这样:

<Object>
<property0>propertyValue</property0>
<FirstNestedObjects>
<FirstNestedObject>
<property1>propertyValue</property1>
</FirstNestedObject>
</FirstNestedObjects>

<SecondNestedObjects>
<SecondNestedObject>
<property2>propertyValue</property2>
</SecondNestedObject>
</SecondNestedObjects>
</Object>

我希望将此 XML 解析为 3 个表:ObjectsFirstNestedObjectsSecondNestedObjects

每个表的列都是对象内部的属性。我希望这样做,以便我可以对聚合的 FirstNestedObjects 和 SecondNestedObjects 进行分析。

我试着查看他们位于此处的文档:https://github.com/dvasilen/Hive-XML-SerDe/wiki/XML-data-sources然而,它仅显示了如何将信息解析到单个表中。

关于我应该如何解决这个问题有什么想法吗?

最佳答案

一个可能的解决方案可能是创建一个包含 3 个分区的分区表。在您的查询中,您可以将数据写入所需的分区。所以最后您将拥有 3 个单独的目录,您可以在这些目录上创建表以单独查询它们。

关于xml - 使用 Hive XML SerDe 将 XML 解析为多个表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54041523/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com