gpt4 book ai didi

regex - 如何使用 regex_replace 替换 pyspark 数据框中列中的特殊字符

转载 作者:行者123 更新时间:2023-12-04 16:06:39 36 4
gpt4 key购买 nike

数据框中有一列batch。它具有 '9%'、'$5' 等值。

我需要使用 regex_replace 从上面的例子中删除特殊字符并只保留数字部分。

9 和 5 等示例分别替换同一列中的 9% 和 $5。

最佳答案

df.withColumn("batch",regexp_replace(col("batch"), "/[^0-9]+/", ""))

关于regex - 如何使用 regex_replace 替换 pyspark 数据框中列中的特殊字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47925167/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com