gpt4 book ai didi

amazon-web-services - AWS Glue - Avro snappy 压缩读取错误 - HIVE_CANNOT_OPEN_SPLIT : Error opening Hive split

转载 作者:可可西里 更新时间:2023-11-01 16:28:08 32 4
gpt4 key购买 nike

在使用 AWS Glue 在 S3 中使用 snappy 压缩(gzip/bzip2 压缩也有同样的错误)保存 Avro 文件后,当我尝试使用 AWS Crawler 读取 athena 中的数据时,我收到以下错误 - HIVE_CANNOT_OPEN_SPLIT:打开 Hive 时出错拆分 - 使用 org.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat:不是数据文件。知道为什么我会收到此错误以及如何解决吗?

最佳答案

谢谢。

通过在执行期间将原生 spark avro jar 文件附加到胶水作业并使用原生 spark 读/写方法以 avro 格式和压缩设置 spark.conf.set("spark.sql.avro .compression.codec","snappy") 一旦创建了 spark session 。

非常适合我,也可以通过 Athena 阅读。

关于amazon-web-services - AWS Glue - Avro snappy 压缩读取错误 - HIVE_CANNOT_OPEN_SPLIT : Error opening Hive split,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51665574/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com