gpt4 book ai didi

r - 在 R 中获取一定天数的平均值

转载 作者:行者123 更新时间:2023-12-02 08:18:03 25 4
gpt4 key购买 nike

假设我有这个数据框

Date           DayOfWeek    Url    Hits
09/01/2016 Thursday url1 3
09/01/2016 Thursday url2 5
09/01/2016 Thursday url3 4
09/02/2016 Friday url1 7
09/02/2016 Friday url3 6
09/03/2016 Saturday url2 9
09/03/2016 Saturday url1 5
09/04/2016 Sunday url2 6
09/07/2016 Wednesday url10 4
09/07/2016 Thursday url2 3
09/07/2016 Thursday url4 2
09/07/2016 Thursday url5 3
09/07/2016 Thursday url1 3
09/08/2016 Friday url1 3
09/08/2016 Friday url4 3
09/08/2016 Friday url5 2
09/08/2016 Friday url8 6
09/09/2016 Saturday url2 1
09/09/2016 Saturday url3 2
09/09/2016 Saturday url5 4
09/09/2016 Saturday url1 8
09/14/2016 Thursday url1 3
09/147/2016 Thursday url2 2
09/14/2016 Thursday url3 3

我想根据访问的唯一 url 的数量获得一周中最繁忙的一天。例如,在数据框中有 3 个星期四,第一个星期四访问了 3 个唯一的 url,第二个星期四有 4 个,最后一个星期四有 3 个...我打算做的是,将 url 的数量加起来 = 3 + 4 + 3/(# of thursdays = 3) = 这一天的唯一 url 平均数量....

对于星期五,第一个是 2 个 url,第二个是 4 个,计算将是 2 + 4/数据集中星期五的数量 = 2

我正在尝试通过 dplyr 解决这个问题。我正在尝试使用 group_by,但我似乎无法确定正确的函数组合来达到我的需要。

最佳答案

我们获取每个“日期”和“星期几”的不同“Url”(“N”)的数量(n_distinct)并获取“N”的平均值 ' 对于每个“DayofWeek”。

library(dplyr)
df1 %>%
group_by(Date, DayOfWeek) %>%
summarise(N = n_distinct(Url)) %>%
group_by(DayOfWeek) %>%
summarise(N = mean(N))
# DayOfWeek N
# <chr> <dbl>
#1 Friday 3.000000
#2 Saturday 3.000000
#3 Sunday 1.000000
#4 Thursday 3.333333
#5 Wednesday 1.000000

关于r - 在 R 中获取一定天数的平均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40056882/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com