gpt4 book ai didi

r - 检查一个数据帧是否是另一个数据帧的重新排序

转载 作者:行者123 更新时间:2023-12-01 12:45:16 25 4
gpt4 key购买 nike

这个问题在这里已经有了答案:





Test whether a dataframe is a sorted version of another dataframe

(2 个回答)


7年前关闭。




我有两个在两个不同场合生成的数据框,但我怀疑它们是相等的。两者都有相同的行数和列数,从视觉上看,它们似乎是相同的,除了行的排序方式。

两者都没有我可以重新排序的 ID 列,我能做的最好的事情就是通过 process_number 重新排序两者。变量,这是我能得到的最接近唯一列的变量。然而,即使在重新排序之后 identical yield FALSEall.equal给我这个(总结):

 [1] "Component 2: 32 string mismatches"
[16] "Component 18: 'is.NA' value mismatch: 183357 in current 183357 in target"
[23] "Component 27: Mean relative difference: 0.4688722"
[24] "Component 28: Mean relative difference: 0.0004968944"
[26] "Component 30: Attributes: < Component 2: 365 string mismatches >"
[28] "Component 31: 'current' is not a factor"

最佳答案

我为这些情况找到的最佳选择是使用“比较”包:

library(compare)
compare(df1, df2, allowAll = TRUE)
allowAll参数尝试不同的转换(例如,重新排序行、重新排序列、将列类型从因子更改为字符等),然后为您总结不同转换后两个输入是否相同。如果应用转换后它们相同,它会告诉您需要哪些转换才能使它们相同。

关于r - 检查一个数据帧是否是另一个数据帧的重新排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20706019/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com