gpt4 book ai didi

r - 根据规则合并R中的两行数据

转载 作者:行者123 更新时间:2023-12-04 00:09:56 26 4
gpt4 key购买 nike

enter image description here我使用 bind_rows 合并了两个数据框。我有一种情况,我有两行数据,如下例所示:

Page Path                           Page Title             Byline      Pageviews 
/facilities/when-lighting-strikes NA NA 668
/facilities/when-lighting-strikes When Lighting Strikes Tom Jones NA

当我有这些类型的重复页面路径时,我想合并相同的页面路径,删除第一行中的两个 NA,保留页面标题(When Lighting Strikes)和署名(Tom Jones),然后保留第一行的综合浏览量结果为 668。不知何故,我似乎需要

  1. 识别重复的页面路径
  2. 查看是否有不同的标题和署名;删除 NA
  3. 保留页面浏览结果所在的行;删除 NA 行

有没有办法在 R dplyr 中做到这一点?或者有更好的方法吗?

最佳答案

一个简单的解决方案:

library(dplyr)

df %>% group_by(PagePath) %>% summarise_each(funs(na.omit))
# Source: local data frame [1 x 4]
#
# PagePath PageTitle Byline Pageviews
# (fctr) (fctr) (fctr) (int)
# 1 /facilities/when-lighting-strikes When Lighting Strikes Tom Jones 668

如果您的数据更复杂,您可能需要更稳健的方法。


数据

df <- structure(list(PagePath = structure(c(1L, 1L), .Label = "/facilities/when-lighting-strikes", class = "factor"), 
PageTitle = structure(c(NA, 1L), .Label = "When Lighting Strikes", class = "factor"),
Byline = structure(c(NA, 1L), .Label = "Tom Jones", class = "factor"),
Pageviews = c(668L, NA)), .Names = c("PagePath", "PageTitle",
"Byline", "Pageviews"), class = "data.frame", row.names = c(NA,
-2L))

关于r - 根据规则合并R中的两行数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37547891/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com