gpt4 book ai didi

amazon-web-services - 如何为爬取的表设置名称?

转载 作者:行者123 更新时间:2023-12-03 16:41:06 26 4
gpt4 key购买 nike

AWS 爬网程序具有用于添加新表的前缀属性。因此,如果我将前缀留空并启动爬虫到 s3://my-bucket/some-table-backup它创建名为 some-table-backup 的表.有没有办法将它重命名为 my-awesome-table并保持爬虫更新重命名的表?或者设置爬虫以创建具有提供名称的新表?

最佳答案

设置爬虫来执行此操作是不可能的,但是创建一个新表的速度非常快,该表在各方面都与爬虫创建的表相同,但名称除外。在 Python :

import boto3

database_name = "database"
table_name = "prefix-dir_name"
new_table_name = "more_awesome_name"

client = boto3.client("glue")
response = client.get_table(DatabaseName=database_name, Name=table_name)
table_input = response["Table"]
table_input["Name"] = new_table_name
# Delete keys that cause create_table to fail
table_input.pop("CreatedBy")
table_input.pop("CreateTime")
table_input.pop("UpdateTime")
table_input.pop("DatabaseName")
table_input.pop("IsRegisteredWithLakeFormation")
catalog_id = table_input.pop("CatalogId")
client.create_table(
DatabaseName=database_name,
TableInput=table_input,
CatalogId=catalog_id
)

关于amazon-web-services - 如何为爬取的表设置名称?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48322330/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com