gpt4 book ai didi

python - 为 google bigquery 构建一个 docker 镜像

转载 作者:行者123 更新时间:2023-12-02 02:52:23 25 4
gpt4 key购买 nike

我在 Google BigQuery 上有大量数据(数百千兆),为了易于使用(许多查询后处理),我正在使用 bigquery python 包。问题是,每当我关闭笔记本电脑时,我都必须再次运行所有查询,这非常昂贵,因为我的数据集大约为 1 Tera。我想到了谷歌计算引擎,但这是一个糟糕的解决方案,因为如果我不停止它们,我仍然会为我的机器付费。我的最后一个解决方案是在我们自己的沙箱上安装一个 docker 镜像,这更便宜,而且可以完全满足我的需求。所以我想知道是否有人为 BigQuery 安装了 docker 镜像?感谢您的帮助!

最佳答案

我们将所有 python/bigquery 项目安装到 docker 容器中,并将它们推送到谷歌云注册表。

可以使用 Google Cloud Composer (Airflow) 处理自动调度、依赖关系图和日志记录。设置起来非常简单,而且 Airflow 有一个 Kubernetes Pod Operator,它允许您指定一个 Python 文件以在 GCR 上的 docker 镜像中运行。您可以使用此工作流来确保您的所有查询和 Python 脚本都在 GCP 上运行,而无需担心 Google Compute Engine 或任何 DevOps 类型的事情。

https://cloud.google.com/composer/docs/how-to/using/using-kubernetes-pod-operator
https://cloud.google.com/composer/

关于python - 为 google bigquery 构建一个 docker 镜像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51703721/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com