gpt4 book ai didi

pyspark - 在pyspark中,如何在列中添加/合并字符串?

转载 作者:行者123 更新时间:2023-12-04 22:40:04 25 4
gpt4 key购买 nike

我想将字符串添加到现有列。例如,df['col1']的值为'1', '2', '3'等,我想在'000'的左侧合并字符串col1,这样我就可以得到一列(新列或替换旧列都没有关系)为< cc>。

我以为我应该使用'0001', '0002', '0003',但是由于pyspark dataframe是不可变的,因此它当然不起作用?

这应该是一个简单的任务,但是我没有在网上找到任何东西。希望有人能给我一些帮助!

谢谢!

最佳答案

from pyspark.sql.functions import concat, col, lit


df.select(concat(col("firstname"), lit(" "), col("lastname"))).show(5)
+------------------------------+
|concat(firstname, , lastname)|
+------------------------------+
| Emanuel Panton|
| Eloisa Cayouette|
| Cathi Prins|
| Mitchel Mozdzierz|
| Angla Hartzheim|
+------------------------------+
only showing top 5 rows


http://spark.apache.org/docs/2.0.0/api/python/pyspark.sql.html#module-pyspark.sql.functions

关于pyspark - 在pyspark中,如何在列中添加/合并字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49397966/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com