gpt4 book ai didi

apache-spark - 来自 Kafka Consumer 的 Spark Streaming

转载 作者:行者123 更新时间:2023-12-04 18:32:32 25 4
gpt4 key购买 nike

我可能需要与 Kafka 合作,而且我对它完全陌生。我知道有 Kafka 生产者会将日志(在 Kafka 中称为事件或消息或记录)发布到 Kafka 主题。

我将需要通过消费者阅读 Kafka 主题。我是否需要先设置消费者 API,然后才能使用 SparkStreaming Context(PySpark) 进行流式传输,或者我可以直接使用 KafkaUtils 模块从 kafka 主题中读取?

如果我需要设置 Kafka 消费者应用程序,我该怎么做?请您分享指向正确文档的链接。

提前致谢!!

最佳答案

Spark 提供内部 kafka 流,您不需要在其中创建自定义使用者,有 2 种方法可以将 kafka 1 与接收器 2 连接。直接方法。
有关更多详细信息,请访问此链接 http://spark.apache.org/docs/latest/streaming-kafka-integration.html

关于apache-spark - 来自 Kafka Consumer 的 Spark Streaming,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38137958/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com