gpt4 book ai didi

使用R从文本中删除标点符号

转载 作者:行者123 更新时间:2023-12-04 02:55:18 25 4
gpt4 key购买 nike

我需要从文本中删除标点符号。我正在使用 tm 包,但问题是:

例如:文本是这样的:

data <- "I am a, new comer","to r,"please help","me:out","here"

现在当我运行时
library(tm)
data<-removePunctuation(data)

在我的代码中,结果是:
I am a new comerto rplease helpmeouthere 

但我期望的是:
I am a new comer to r please help me out here

最佳答案

以下是我如何回答您的问题,以及与上述评论中的@David Arenburg 非常接近的答案。

 data <- '"I am a, new comer","to r,"please help","me:out","here"'
gsub('[[:punct:] ]+',' ',data)
[1] " I am a new comer to r please help me out here "

[:punct:] 后面的多余空格是为字符串添加空格,+ 匹配正则表达式中的一个或多个连续项。在某些情况下,这具有将任何空格序列缩短为单个空格的副作用。

关于使用R从文本中删除标点符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29098801/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com