gpt4 book ai didi

python - 使用 lower 函数在文本清理中将 pyspark 数据框中单列中的值转换为小写

转载 作者:行者123 更新时间:2023-12-02 03:21:06 24 4
gpt4 key购买 nike

尝试使用 .lower 函数将 pyspark 数据帧单列中的值转换为小写以进行文本清理

import pyspark.sql.functions as f
f.lower(f.col(col("subject")).show()

获取:

SyntaxError: unexpected EOF while parsing

最佳答案

你的问题是括号,而且你只需要使用 f.col() 一次。

import pyspark.sql.functions as f
f.lower(f.col("subject")).show()

您需要将其分配给您的数据框:

import pyspark.sql.functions as f
df = df.withColumn("subject",f.lower(f.col("subject")))
df.show()

关于python - 使用 lower 函数在文本清理中将 pyspark 数据框中单列中的值转换为小写,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54791245/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com