gpt4 book ai didi

hive - Sqoop、Avro 和 Hive

转载 作者:行者123 更新时间:2023-11-30 23:58:56 24 4
gpt4 key购买 nike

我目前正在使用 avro 格式的 Sqoop 从 Mysql 导入 HDFS,效果很好。然而,将这些文件加载​​到 HIVE 中的最佳方式是什么?

由于 avro 文件包含模式,我可以将文件拉到本地文件系统,使用 avro 工具并使用提取的模式创建表,但这似乎过多?

此外,如果从 mysql 中的表中删除了一个列,我是否仍可以将旧文件加载到使用新 avro 模式创建的新 HIVE 表中(删除的列丢失)?

最佳答案

在 9.1 版本之后,Hive 打包了一个 Avro Hive SerDe。这允许 Hive 直接从 Avro 文件读取,而 Avro 仍然“拥有”架构。

对于第二个问题,您可以使用列默认值定义 Avro 架构。当您添加一个新列时,只需确保指定一个默认值,您所有的旧 Avro 文件都可以在新的 Hive 表中找到。

要开始,您可以找到文档 here Programming Hive 一书(在 Safari Books Online 上可用)有一个 section on the Avro HiveSerde您可能会发现它更具可读性。

关于hive - Sqoop、Avro 和 Hive,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16109585/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com