gpt4 book ai didi

R - 匹配两个数据框中的两列

转载 作者:行者123 更新时间:2023-12-03 19:11:22 26 4
gpt4 key购买 nike

我正在尝试操作满足某些条件的数据框。

有主数据框 df1:

Title             Artist        Warner    Sony    Universal
Break My Heart Dua Lipa 0 0 0
Daisies Katy Perry 0 0 1
Nicotine Chef`Special 1 1 0
... 1 000 000+ rows

df2:
Label       Title            Artist        Operation
Warner Nicotine Chef`Special 0
Sony Break my Heart Dua Lipa 1
... 100+ rows

Df1 包含一些错误。在这种情况下,尼古丁的 Warner 值为 1,而它应该为 0。我希望从两个数据框中匹配 Title 和 Artist,然后根据 df2 将标签值更改为 1 或 0。

在这种情况下,它应该看到 Chef'Special 的 Nicotine 在 df1 和 df2 中,并且应该将 df1$Warner 更改为 0。Dua Lipa 的 Break My Heart 应该使用相同的方法将 df1$Sony 设置为 1。

我一直在考虑如何解决这个问题已经有一段时间了,但我完全不知所措。

最佳答案

这是使用合并的一种选择,没有您的数据所以使用 mtcars举个例子:

df1 = head(mtcars, 5)
df2 = subset(head(within(df1,mpg <- mpg * 2),2), select = "mpg")


df3 <- merge(df1, df2, by = 0, all.x = TRUE)
df3 <- within(df3, mpg <- ifelse(is.na(mpg.y),
mpg.x, mpg.y))[-(2:3)]

关于R - 匹配两个数据框中的两列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61991868/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com