gpt4 book ai didi

从 R 中的单元格中删除重复的单词

转载 作者:行者123 更新时间:2023-12-05 01:44:49 24 4
gpt4 key购买 nike

我有一个双列数据框,其中第一列是数字,第二列包含研究类别列表。我的数据的简化版本:

aa <- data.frame(a=c(1:4),b=c("Fisheries, Fisheries, Geography, Marine Biology", 
"Fisheries", "Marine Biology, Marine Biology, Fisheries, Zoology", "Geography"))

我想将 b 列转换为唯一的元素列表,即删除重复项,以便最终结果是

    a        b
1 Fisheries, Geography, Marine Biology
2 Fisheries
3 Marine Biology, Fisheries, Zoology
4 Geography

我可以对列表的单个元素执行此操作,例如,使用 unique(unlist(strsplit(aa[1]))) 但仅限于单个元素,而不是整个列(否则它会为整个列返回一个唯一列表)。我不知道如何对整个列表执行此操作,一次一个元素。也许使用 lapply 并为 *unique(unlist(strsplit())) 编写我自己的函数?

非常感谢!

最佳答案

这应该适合你。

aa <- data.frame(a=c(1:4),b=c("Fisheries, Fisheries, Geography, Marine Biology", 
"Fisheries", "Marine Biology, Marine Biology, Fisheries, Zoology", "Geography"))

aa$b <- sapply(aa$b, function(x) paste(unique(unlist(str_split(x,", "))), collapse = ", "))

关于从 R 中的单元格中删除重复的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44684052/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com