gpt4 book ai didi

java - Spark SQL 中的 rank() 函数用法

转载 作者:搜寻专家 更新时间:2023-11-01 03:17:44 25 4
gpt4 key购买 nike

在使用 rank() 时需要一些指导

我从数据集中提取了一列..需要进行排名。

Dataset<Row> inputCol= inputDataset.apply("Colname");    
Dataset<Row> DSColAwithIndex=inputDSAAcolonly.withColumn("df1Rank", rank());

DSColAwithIndex.show();

我可以对列进行排序,然后附加一个索引列来获得排名...但对 rank() 的已知语法和用法感到好奇

最佳答案

Window 规范需要指定给 rank()

val w = org.apache.spark.sql.expressions.Window.orderBy("date") //some spec    

val leadDf = inputDSAAcolonly.withColumn("df1Rank", rank().over(w))

编辑:答案的 Java 版本,作为使用 Java 的 OP

import org.apache.spark.sql.expressions.WindowSpec; 
WindowSpec w = org.apache.spark.sql.expressions.Window.orderBy(colName);
Dataset<Row> leadDf = inputDSAAcolonly.withColumn("df1Rank", rank().over(w));

关于java - Spark SQL 中的 rank() 函数用法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42617725/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com