gpt4 book ai didi

google-cloud-dataflow - Http get/post 到数据流

转载 作者:行者123 更新时间:2023-12-04 06:10:29 24 4
gpt4 key购买 nike

我正在尝试将一些数据放入数据流中,但数据不在云存储中 - 它是一个 rss 提要,我通常每 x 小时检查一次。有没有一种方法可以直接使用 SDK 来执行此操作,还是我必须先通过其他方式将文件放到云存储中。

提前致谢。

最佳答案

Dataflow 不提供 RSS 提要的来源。

您可以从 ParDo 发出 HTTP 请求来获取数据。例如,假设提要允许您在某个时间范围内获取消息。然后您可以创建一个输入集合,其中每条记录代表一个时间范围(例如一个小时)。然后您可以编写一个 ParDo 来获取该时间范围内的消息并发出它们。

如果您参与了流媒体抢先体验预览,那么一种解决方案是编写一个 App Engine 应用程序(或等效应用程序),每隔 X 小时检查一次 RSS 提要,然后使用 Google Cloud PubSub 发布数据。然后你可以使用 PubSubIO在 Dataflow 中读取这些事件。

关于google-cloud-dataflow - Http get/post 到数据流,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28156735/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com