gpt4 book ai didi

regex - Scala 如何删除字符串前面和末尾的引号

转载 作者:行者123 更新时间:2023-12-03 02:09:52 29 4
gpt4 key购买 nike

我有一个数据框,其中一些字符串在字符串的前面和末尾包含“”。

例如:

+-------------------------------+
|data |
+-------------------------------+
|"john belushi" |
|"john mnunjnj" |
|"nmnj tyhng" |
|"John b-e_lushi" |
|"john belushi's book" |

预期输出:

+-------------------------------+
|data |
+-------------------------------+
|john belushi |
|john mnunjnj |
|nmnj tyhng |
|John b-e_lushi |
|john belushi's book |

我试图仅从字符串中删除 "双引号。有人可以告诉我如何在 Scala 中删除它吗?

Python提供了ltrim和rtrim。 Scala 中有等同的东西吗?

最佳答案

使用expr、substringlength函数并从2length() - 2获取子字符串

val df_d = List("\"john belushi\"", "\"John b-e_lushi\"", "\"john belushi's book\"")
.toDF("data")

输入:

+---------------------+
|data |
+---------------------+
|"john belushi" |
|"John b-e_lushi" |
|"john belushi's book"|
+---------------------+

使用 expr、子字符串和长度函数:

import org.apache.spark.sql.functions.expr

df_d.withColumn("data", expr("substring(data, 2, length(data) - 2)"))
.show(false)

输出:

+-------------------+
|data |
+-------------------+
|john belushi |
|John b-e_lushi |
|john belushi's book|
+-------------------+

关于regex - Scala 如何删除字符串前面和末尾的引号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56203473/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com