gpt4 book ai didi

amazon-web-services - 作为源的数据目录表

转载 作者:行者123 更新时间:2023-12-03 07:35:53 25 4
gpt4 key购买 nike

我正在尝试创建一个爬网程序来扫描 S3 存储桶 Parquet 文件并更新 Glue 数据目录中现有表的分区信息。

这就是我正在谈论的确切功能。 https://aws.amazon.com/about-aws/whats-new/2019/05/aws-glue-crawlers-now-support-existing-data-catalog-tables-as-sources/

当然,在控制台中工作,但是,在使用 cloudformation 创建 AWS::Glue::Crawler 时,我没有找到从 DataCatalog 提供表名称的选项。这是一个未添加到 cloudformation 的功能还是我在文档中找不到它。

还有其他选择吗?

最佳答案

它以 s3 存储桶中的文件夹名称作为表名称。您可以使用TablePrefix添加前缀。但现阶段还没有办法显式指定表名。

关于amazon-web-services - 作为源的数据目录表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58331426/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com