gpt4 book ai didi

r - 添加(不合并!)行和列不相等的两个数据框

转载 作者:行者123 更新时间:2023-12-04 03:50:00 24 4
gpt4 key购买 nike

我想有效地求和两个数据帧的条目,尽管不能保证数据帧具有相同的维数或列名。合并并不是我真正想要的。相反,我想创建一个输出对象,其中所有行和列的名称都属于所添加的数据帧中的任何一个。在该输出的每个位置,我想对计算值使用以下逻辑:

  • 如果行/列对同时属于两个输入数据帧,我希望输出包含它们的总和
  • 如果行/列对仅属于一个输入数据帧,我想将该值包括在输出
  • 如果行/列对不属于任何输入矩阵,我希望输出中的该位置为0。

  • 例如,请考虑以下输入数据帧:
    df1 = data.frame(x = c(1,2,3), y = c(4,5,6))
    rownames(df1) = c("a", "b", "c")
    df2 = data.frame(x = c(7,8), z = c(9,10), w = c(2, 3))
    rownames(df2) = c("a", "d")
    > df1
    x y
    a 1 4
    b 2 5
    c 3 6
    > df2
    x z w
    a 7 9 2
    d 8 10 3

    我希望最终结果是
    > df2
    x y z w
    a 8 4 9 2
    b 2 5 0 0
    c 3 6 0 0
    d 8 0 10 3

    到目前为止,我已经做了-

    dplyr中的bind_rows/bind_cols可以抛出以下内容:
    “错误:行数不兼容(3,预期为2)”

    我有重复的列名,所以“合并”也无法满足我的目的-由于某种原因返回了一个空df。

    最佳答案

    似乎您可以合并行名,然后注意总和,并将NA转换为零,并进行一些额外的调整:

    library(dplyr)

    df.new = df1 %>% add_rownames %>%
    full_join(df2 %>% add_rownames, by="rowname") %>%
    mutate_each(funs(replace(., which(is.na(.)), 0))) %>%
    mutate(x = x.x + x.y) %>%
    select(rowname,x,y,z,w)

    或者,使用@DavidArenburg更加优雅和可扩展的解决方案:
    df.new = df1 %>% add_rownames %>% 
    full_join(df2 %>% add_rownames) %>%
    group_by(rowname) %>%
    summarise_each(funs(sum(., na.rm = TRUE)))

    df.new

    rowname x y z w
    1 a 8 4 9 2
    2 b 2 5 0 0
    3 c 3 6 0 0
    4 d 8 0 10 3

    关于r - 添加(不合并!)行和列不相等的两个数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35162993/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com