gpt4 book ai didi

amazon-dynamodb - 从 Spark 程序连接 DynamoDB 以使用 Python 从一张表中加载所有项目?

转载 作者:行者123 更新时间:2023-12-04 06:59:44 24 4
gpt4 key购买 nike

我编写了一个程序来将项目写入 DynamoDB 表。现在我想使用 PySpark 从 DynamoDB 表中读取所有项目。在 Spark 中是否有任何库可用于执行此操作?

最佳答案

您可以使用 parallel scans可作为 DynamoDB API 的一部分提供通过 boto3以及类似为 PySpark 编写的并行 S3 文件处理应用程序描述的方案 here .基本上,不是先验读取所有键,只需创建一个段号列表,并在 map_func 中硬编码扫描段的最大数量。 Spark 的函数。

关于amazon-dynamodb - 从 Spark 程序连接 DynamoDB 以使用 Python 从一张表中加载所有项目?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35209694/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com