gpt4 book ai didi

只删除数字但在 R 中保留像 "3D"这样的词?

转载 作者:行者123 更新时间:2023-12-01 13:48:12 24 4
gpt4 key购买 nike

我最近一直在用 R 编码文本挖掘,但我在处理数据预处理方面遇到了麻烦。
我有一个像下面这样的字符串:

"I want to buy 3D printer, but it costs 3000 dollars."

我想保留单词“3D”但删除“3000”,它应该如下所示:
"I want to buy 3D printer, but it costs dollars."

我用 corpus <- tm_map(corpus, removeNumbers)但这将删除文本中的所有数字,因此我将在结果中使用术语“D 打印机”,但它应该是“3D 打印机”。

有没有办法解决这个问题?谢谢!

最佳答案

我们可以使用 sub

gsub('3\\d+\\s', '', str1)

如果这需要通用,
gsub('\\b\\d+\\s', '', str1)
#[1] "I want to buy 3D printer, but it costs dollars."

关于只删除数字但在 R 中保留像 "3D"这样的词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34172253/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com