gpt4 book ai didi

python-3.x - 如何将存储在 GG Bigquery 中的数据导出到 GZ 文件中。

转载 作者:行者123 更新时间:2023-12-01 13:17:58 25 4
gpt4 key购买 nike

我使用这段代码将数据导出到一个 csv 文件并且它有效:

project_id = 'project_id'
client = bigquery.Client()
dataset_id = 'dataset_id'
bucket_name = 'bucket_name'
table_id = 'table_id'

destination_uri = 'gs://{}/{}'.format(bucket_name, 'file.csv')
dataset_ref = client.dataset(dataset_id, project=project_id)
table_ref = dataset_ref.table(table_id)

extract_job = client.extract_table(
table_ref,
destination_uri)
extract_job.result()

但我更喜欢GZ文件,因为我的表高达700M。谁能帮我将数据导出到 GZ 文件中?

最佳答案

您需要添加一个 jobConfig,如下所示:

job_config = bigquery.job.ExtractJobConfig()
job_config.compression = 'GZIP'

完整代码:

from google.cloud import bigquery
client = bigquery.Client()

project_id = 'fh-bigquery'
dataset_id = 'public_dump'
table_id = 'afinn_en_165'


bucket_name = 'your_bucket'

destination_uri = 'gs://{}/{}'.format(bucket_name, 'file.csv.gz')

dataset_ref = client.dataset(dataset_id, project=project_id)
table_ref = dataset_ref.table(table_id)

job_config = bigquery.job.ExtractJobConfig()
job_config.compression = 'GZIP'
extract_job = client.extract_table(
table_ref,
destination_uri,
job_config = job_config
)
extract_job.result()

关于python-3.x - 如何将存储在 GG Bigquery 中的数据导出到 GZ 文件中。,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52827721/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com