gpt4 book ai didi

scala - 从数据框 Spark 中删除一列

转载 作者:太空狗 更新时间:2023-10-29 22:38:41 29 4
gpt4 key购买 nike

我有一个包含大量列的 Spark 数据框。我想从中删除两列以获得新的数据框。

如果列数较少,我可以像这样在 API 中使用 select 方法:

pcomments = pcomments.select(pcomments.col("post_id"),pcomments.col("comment_id"),pcomments.col("comment_message"),pcomments.col("user_name"),pcomments.col("comment_createdtime"));

但由于从长列表中选择列是一项乏味的任务,是否有解决方法?

最佳答案

使用drop方法和withColumnRenamed方法。

例子:

    val initialDf= ....

val dfAfterDrop=initialDf.drop("column1").drop("coumn2")

val dfAfterColRename= dfAfterDrop.withColumnRenamed("oldColumnName","new ColumnName")

关于scala - 从数据框 Spark 中删除一列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41763227/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com