gpt4 book ai didi

python - 在 Apache Beam DirectRunner 中使用 KafkaIO 时出错

转载 作者:行者123 更新时间:2023-12-04 18:49:40 25 4
gpt4 key购买 nike

我正在使用 apache beam DirectRunner 从 kafka 主题加载数据。我的代码如下:

conf={'bootstrap.servers':'localhost:9092'}

with beam.Pipeline() as pipeline:
(pipeline
| ReadFromKafka(consumer_config=conf,topics=['topic1'])
)
我正在使用以下命令来运行此代码:
python3 topic_to_gcs --runner DirectRunner
出现以下错误:
File "/usr/lib/python3.7/subprocess.py", line 1522, in _execute_child
raise child_exception_type(errno_num, err_msg, err_filename)
FileNotFoundError: [Errno 2] No such file or directory: 'docker': 'docker'
提前致谢 :)

最佳答案

目前,Apache Beam 使用所谓的外部转换从 Python SDK 中的 Kafka 读取。这实际上意味着,您的 Python 管道将生成一个 Java 容器并从容器内部连接到 Kafka。然后它将数据传回你的 Python 管道(更多关于这个 here )。
如果您可以在运行管道的主机上安装 docker(以及在您计划运行它的所有其他位置,如果您将运行器从 DirectRunner 更改为某个分布式运行器),那么这将是最好的选择。
否则,您可以在我的回答 here 中了解当前状态。 .

关于python - 在 Apache Beam DirectRunner 中使用 KafkaIO 时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62782455/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com