gpt4 book ai didi

r - 使用重复时忽略大小写

转载 作者:行者123 更新时间:2023-12-05 02:20:29 25 4
gpt4 key购买 nike

我正在使用 R 中的重复函数删除数据框中的重复行。

 df:

Name Rank
A 1
a 1
B 2


df[!duplicated(df),]

Name Rank
A 1
a 1
B 2

第二行与第一行相同,但不会因为考虑了 "A"和 "a" 的大小写而被删除。这有什么转机?谢谢。

最佳答案

# If it's okay to change the case
df.lower <- df
df.lower$Name <- tolower(df$Name)

df.lower[!duplicated(df.lower$Name),]

# If you don't want to change the case
df[!duplicated(df.lower$Name),]

或者只是

df[!duplicated(tolower(df$Name)),]
  Name Rank
1 A 1
3 B 2

这是基于Name的重复数据删除。对于整行你可以这样做:

df.lower[!duplicated(df.lower),] # changes the case

df[!duplicated(cbind(tolower(df$Name),df$Rank)),] # does not change case

关于r - 使用重复时忽略大小写,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39168046/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com