gpt4 book ai didi

scala - 从 Spark 写入 DynamoDB

转载 作者:行者123 更新时间:2023-12-04 15:41:48 27 4
gpt4 key购买 nike

我正在尝试使用 spark 从 amazon s3(以 DataFrame 或 RDD 的形式)获取文件,进行一些简单的转换,然后将文件发送到 DynamoDB 上的表。

在阅读了其他一些论坛帖子后,我开始了解读取/写入 DynamoDB 需要使用 hadoopRDD - 这与 spark 中的 RDD 不同 - 也不同于我检索我的 s3 文件的那个。

我将如何将 DataFrame/RDD 从 s3 中的文件更改为 hadoopRDD,以便我可以将其发送回去?

我正在使用 Scala 并测试 spark-shell 中的所有内容。

再次提前致谢!

最佳答案

您可以使用 EMR DynamoDB Connector由亚马逊实现。它实现了 DynamoDBInputFormat 和 DynamoDBOutputFormat,允许从 DynamoDB 读取和写入数据。

您可以在此 blog post 中阅读有关此内容的更多信息.

关于scala - 从 Spark 写入 DynamoDB,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37444607/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com