gpt4 book ai didi

r - 比较 R 中的 2 个数据集

转载 作者:行者123 更新时间:2023-12-02 06:41:15 26 4
gpt4 key购买 nike

我从名为 babies2009 的数据集中提取了 2 个数据集(3 个向量计数、姓名、性别)

一个是包含所有女孩的 girls2009,另一个是 boys2009。我想找出男孩和女孩之间有哪些相似的名字。

我试过了

common.names = (boys2009$name %in% girls2009$name)

当我尝试

babies2009[common.names, ] [1:10, ]

我得到的只是女孩的名字,而不是普通名字。

我已经通过取 10 个样本来确认这两个数据集确实分别包含男孩和女孩......

boys2009 [1:10,]
girsl2009 [1:10,]

我还能如何比较这 2 个数据集并确定它们共享的值。谢谢,

最佳答案

common.names = (boys2009$name %in% girls2009$name) 为您提供长度为 length(boys2009$name) 的逻辑向量。因此,当您尝试从一个更长的 data.frame babies2009[common.names, ] [1:10, ] 中进行选择时,您会得到一些废话。

解决方案:在正确的 data.frame 上使用该逻辑向量!

boys2009 <- data.frame( names=c("Billy","Bob"),data=runif(2), gender="M" , stringsAsFactors=FALSE)
girls2009 <- data.frame( names=c("Billy","Mae","Sue"),data=runif(3), gender="F" , stringsAsFactors=FALSE)
babies2009 <- rbind(boys2009,girls2009)

common.names <- (boys2009$name %in% girls2009$name)

> boys2009[common.names, ]$names
[1] "Billy"

关于r - 比较 R 中的 2 个数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7459138/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com