gpt4 book ai didi

scala - 如何从 Scala 的 Glue Job 中的 S3 文件创建动态数据框?

转载 作者:行者123 更新时间:2023-12-01 11:14:43 26 4
gpt4 key购买 nike

我在将 Python Glue Job 转换为 Scala Glue Job 时遇到问题,即 create_dynamic_data_frame_options方法。在python中,语法是:

dyf = glueContext.create_dynamic_frame_from_options("s3",
{'paths': file_paths},
format="csv",
format_options={"separator": ",", "quoteChar": '"'})


其中 file_paths 是一个列表 ['s3://bucket1/file1.txt','s3://bucket2/file2.txt'] .如何在 Scala 中做同样的事情?

最佳答案

尝试这个:

val file_paths = Array(
"s3://bucket/data1",
"s3://bucket/data2"
)

val dyf = glueContext.getSourceWithFormat(
connectionType = "s3",
options = JsonOptions(Map("paths" -> file_paths)),
format = "csv",
formatOptions = JsonOptions(Map("separator" -> ",", "quoteChar": "\""))
).getDynamicFrame()

关于scala - 如何从 Scala 的 Glue Job 中的 S3 文件创建动态数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58356140/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com