gpt4 book ai didi

database - 如何检查两个数据帧是否相等

转载 作者:太空狗 更新时间:2023-10-30 01:38:17 25 4
gpt4 key购买 nike

<分区>

假设我在 R 中有大型数据集,我只想知道其中两个是否相同。当我尝试不同的算法来获得相同的结果时,我经常使用它。例如,假设我们有以下数据集:

df1 <- data.frame(num = 1:5, let = letters[1:5])
df2 <- df1
df3 <- data.frame(num = c(1:5, NA), let = letters[1:6])
df4 <- df3

所以这就是我用来比较它们的方法:

table(x == y, useNA = 'ifany')

当数据集没有 NA 时效果很好:

> table(df1 == df2, useNA = 'ifany')
TRUE
10

但当他们有 NA 时就不是那么多了:

> table(df3 == df4, useNA = 'ifany')
TRUE <NA>
11 1

在示例中,很容易忽略 NA这不是问题,因为我们知道两个数据帧 是相等的。问题是 NA == <anything>产量 NA ,所以只要其中一个数据集有 NA , 另一个人在同一个位置上有什么并不重要,结果总是 NA .

所以使用 table()比较数据集对我来说似乎并不理想。 如何更好地检查两个数据框是否相同?

P.S.:注意这不是 R - comparing several datasets 的副本, Comparing 2 datasets in RCompare datasets in R

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com