gpt4 book ai didi

python - 如何检索 PCollection 的内容并将其分配给普通变量?

转载 作者:太空宇宙 更新时间:2023-11-04 00:22:28 26 4
gpt4 key购买 nike

我正在使用 Apache-Beam 和 Python SDK。

目前,我的管道读取多个文件,解析它们并从其数据生成 pandas 数据帧。然后,它将它们分组到一个单个数据帧中。

我现在想要的是检索这个单一的胖数据帧,并将其分配给一个普通的 Python 变量。

可以吗?

最佳答案

PCollection 只是执行图中的一个逻辑节点,它的内容不一定实际存储在任何地方,所以这是不可能直接实现的。

但是,您可以要求管道将 PCollection 写入文件(例如,将元素转换为字符串并使用 WriteToTextnum_shards=1),运行管道并等待它完成,然后从您的主程序中读取该文件。

关于python - 如何检索 PCollection 的内容并将其分配给普通变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48668686/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com