gpt4 book ai didi

R:如何在数据框中输出唯一的字符串(文本)?

转载 作者:行者123 更新时间:2023-11-30 09:11:24 27 4
gpt4 key购买 nike

请帮忙。

我有一个包含近 40k 数据点(行)的数据框,其中一列包含文本。例如,

ID  Text
1 I love my mum I love my dad
2 I live in AB I used to live in CD
. .
. .

我希望它输出如下:

ID  Text
1 I love my mum dad
2 I live in AB used to CD
. .
. .

我尝试了 unique()make.unique() 但它们不起作用。

最佳答案

我猜您想从每个句子中删除任何重复的单词。如果是这种情况,您可以尝试:

txt<-c("I love my mum I love my dad","I live in AB I used to live in CD")
vapply(strsplit(txt,"\\s+"),function(x) paste(unique(x),collapse=" "),"")
#[1] "I love my mum dad" "I live in AB used to CD"

关于R:如何在数据框中输出唯一的字符串(文本)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35916670/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com