gpt4 book ai didi

python - 谷歌CP : Where to schedule PubSub subscriber which writes to BigQuery

转载 作者:太空宇宙 更新时间:2023-11-03 21:31:58 26 4
gpt4 key购买 nike

我需要使用 Python 从 PubSub 写入 BigQuery。我测试了一些异步订阅者代码,它工作正常。但这需要持续运行,而且我不能 100% 确定在哪里安排它。我一直在使用 Cloud Composer (Airflow),但它看起来并不理想,而且看起来 Dataflow 是 GCP 推荐的?这是正确的吗?

或者有没有办法从 Cloud Composer 可靠地运行它?我想我可以运行它一次,但我想确保它再次运行,以防它因某种原因失败。

最佳答案

实现此目标的两种最佳方法是使用 Cloud Functions或使用 Cloud Dataflow 。对于 Cloud Functions,您可以在 Pub/Sub 主题上设置触发器,然后在代码中写入 BigQuery。它看起来类似于 tutorial on streaming from Cloud Storage to BigQuery ,但输入是 Pub/Sub 消息。对于数据流,您可以使用 Google-provided, open-source templates to write Pub/Sub messages to BigQuery 之一.

如果您的吞吐量较高(每秒数千条消息)且一致,则云数据流可能更适合。如果您的吞吐量较低或不频繁,云函数可能更适合。这些解决方案中的任何一个都会持续运行,并在可用时将消息写入 BigQuery。

关于python - 谷歌CP : Where to schedule PubSub subscriber which writes to BigQuery,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53467001/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com