gpt4 book ai didi

python - 如何从 Azure Databricks Spark 中的 DataFrame 获取特定行和列

转载 作者:行者123 更新时间:2023-12-02 07:26:35 26 4
gpt4 key购买 nike

我在 Azure Databricks 中有一个 DataFrame,看起来像

Col a| Col b
------------
Marc | Taylor
John | McC
Bill | Gates

我想提取特定的列和行。我知道如何提取特定列并将其分配给变量

result = ds.select(Col a)

但是如何在这行代码中获取第 2 行呢?

最佳答案

您可以使用monotonically_increasing_id()函数生成一个带有序列号的新列,然后使用filter函数在该行中进行过滤

from pyspark.sql.functions import *
ds.withColumn('sn', monotonically_increasing_id())\
.filter(col('sn') == 1)\
.drop('sn')\
.show(truncate=False)

这会给你

+-----+-----+
|Col a|Col b|
+-----+-----+
|John |McC |
+-----+-----+

注意:monotonically_increasing_id会生成递增的订单号,但不保证生成从0开始的序列号。

总而言之,filter()select()/where() 函数是从数据帧中选择行的两种方法

希望我的回答对您有帮助

关于python - 如何从 Azure Databricks Spark 中的 DataFrame 获取特定行和列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52024326/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com