gpt4 book ai didi

python - 为流式插入自动创建 BQ 表

转载 作者:太空宇宙 更新时间:2023-11-03 15:15:08 24 4
gpt4 key购买 nike

也许我弄错了:有没有办法为 tabledata.insertAll 命令自动创建目标表?如果是,请指出正确的方向。

如果不是 - 创建所需表格的最佳方法是什么?在启动时检查现有表并通过从 GCS 加载创建不存在的表?或者它们是否可以直接从代码创建而无需加载作业?

我定义了许多事件类(Python 云端点),完美的解决方案是使用这些定义来创建匹配的 BQ 表。

最佳答案

无法在流式传输期间自动创建表,因为 BigQuery 不知道架构。您发布的 JSON 数据没有类型信息——如果有一个字段“123”,我们不知道它是否总是一个字符串,或者它实际上是否应该是一个整数。此外,如果您发布的数据缺少可选字段,则创建的架构将比您想要的更窄。

创建表的最佳方法是使用 tables.insert() 调用(无需运行加载作业即可从 GCS 加载数据)。您可以准确提供所需的模式,一旦创建了表,您就可以将数据流式传输到它。

在某些情况下,客户会预先创建一个月的表,因此他们只需每 30 天担心一次。在其他情况下,您可能希望在启动时检查表是否存在,如果不存在,则创建它。

关于python - 为流式插入自动创建 BQ 表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21830868/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com