gpt4 book ai didi

apache-spark - Spark Dataframe列,另一列的最后一个字符

转载 作者:行者123 更新时间:2023-12-04 04:11:21 26 4
gpt4 key购买 nike

我正在寻找一种从数据框列中的字符串获取最后一个字符并将其放置到另一列中的方法。

我有一个Spark数据框,看起来像这样:

    animal
======
cat
mouse
snake

我想要这样的东西:
    lastchar
========
t
e
e

现在,我可以使用如下所示的UDF进行此操作:
    def get_last_letter(animal):
return animal[-1]

get_last_letter_udf = udf(get_last_letter, StringType())

df.select(get_last_letter_udf("animal").alias("lastchar")).show()

我主要是想知道如果没有UDF,是否有更好的方法可以做到这一点。谢谢!

最佳答案

只需使用子字符串功能

from pyspark.sql.functions import substring
df.withColumn("b", substring(col("columnName"), -1, 1))

关于apache-spark - Spark Dataframe列,另一列的最后一个字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45512884/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com