gpt4 book ai didi

apache-spark - 如何在pyspark中使用foreach sink?

转载 作者:行者123 更新时间:2023-12-04 05:11:30 29 4
gpt4 key购买 nike

如何在 Python Spark 结构化流中使用 foreach 来触发输出操作。

query = wordCounts\
.writeStream\
.outputMode('update')\
.foreach(func)\
.start()

def func():
ops(wordCounts)

最佳答案

Spark 2.4.0 中添加了对 Python 中 foreach sink 的支持,并更新了文档:http://spark.apache.org/docs/latest/structured-streaming-programming-guide.html#using-foreach-and-foreachbatch

确保您拥有该版本并且您现在可以执行以下操作:

def process_row(row):
# Process row
pass

query = streamingDF.writeStream.foreach(process_row).start()

关于apache-spark - 如何在pyspark中使用foreach sink?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48201647/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com