gpt4 book ai didi

apache-spark - 使用 pyspark 从 s3 读取/加载 avro 文件

转载 作者:行者123 更新时间:2023-12-04 08:53:49 25 4
gpt4 key购买 nike

使用 AWS 胶水开发人员端点 Spark Version - 2.4 Python Version- 3代码:df=spark.read.format("avro").load("s3://dataexport/users/prod-users.avro") 尝试读取 avro 文件时收到以下错误消息:Failed to find data source: avro. Avro is built-in but external data source module since Spark 2.4. Please deploy the application as per the deployment section of "Apache Avro Data Source Guide".; 找到以下链接,但对解决我的问题没有帮助
https://spark.apache.org/docs/latest/sql-data-sources-avro.html[Apache Avro 数据源指南][1]
Apache Avro as a Built-in Data Source in Apache Spark 2.4

最佳答案

你只需要导入那个包

 org.apache.spark:spark-avro_2.11:4.0.0
查看您需要哪个版本 here

关于apache-spark - 使用 pyspark 从 s3 读取/加载 avro 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63950236/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com