gpt4 book ai didi

python - 根据其他列值从 DataFrame 获取值 (PySpark)

转载 作者:行者123 更新时间:2023-11-30 22:52:22 25 4
gpt4 key购买 nike

我有一个 Spark 数据框,我想获取统计信息

stats_df = df.describe(['mycol'])
stats_df.show()
+-------+------------------+
|summary| mycol|
+-------+------------------+
| count| 300|
| mean| 2243|
| stddev| 319.419860456123|
| min| 1400|
| max| 3100|
+-------+------------------+

如何使用 summary min 提取 mycolminmax 的值 最大列值?如何通过数字索引来做到这一点?

最佳答案

您可以轻松地从该数据帧上的选择中分配变量。

x = stats_df.select('mycol').where('summary' == 'min')

关于python - 根据其他列值从 DataFrame 获取值 (PySpark),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38602973/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com