gpt4 book ai didi

apache-spark - Pyspark orderBy asc nulls last

转载 作者:行者123 更新时间:2023-12-05 01:10:17 24 4
gpt4 key购买 nike

在 spark sql 中,可以使用 asc_nulls_last按顺序排列,例如

df.select('*').orderBy(column.asc_nulls_last).show

Changing Nulls Ordering in Spark SQL .

你会如何在 pyspark 中做到这一点?

我专门用它来做“窗口”之类的事情:

df = df.withColumn(
'rank',
row_number().over(Window.partitionBy('group_id').orderBy('datetime'))
)

datetime 在哪里列可以是日期时间或 null。

我希望这样做:

...orderBy(expr('column asc NULLS last'))

但是 Exception: mismatched input 'NULLS' expecting <EOF> 出现此错误

最佳答案

from pyspark.sql import functions as F
df = df.withColumn(
'rank',
F.row_number().over(Window.partitionBy('group_id').orderBy(F.col('datetime').asc_nulls_last()))
)

关于apache-spark - Pyspark orderBy asc nulls last,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64252243/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com