R - 如果日期在范围内，则求和-6ren

R - 如果日期在范围内，则求和

转载作者：行者123 更新时间：2023-12-04 09:36:52

24

4

我已经设法在 excel 中轻松完成此操作，但想在 R 中完成此操作:

我有两个数据框:

MediaPlanDF(215 个观察，29 个变量)

我只关心 4 个变量:

开始日期(飞行日期)，
结束日期(飞行日期)，
每日消费，
每日印象

输出DF(35 obs，1 var)

日期:输出DF[[1]]

从 8/31/15 到 10/4/15 的 35 次观察

这就是设置，或者至少我是如何设置的(所有日期格式正确)。

我需要做的是向 ouputDF 添加 2 列:Daily Impressions & Daily Spend

Daily Impressions = 如果 OutputDF 中的日期在 MediaPlanDF 的开始和结束日期内，则汇总所有符合该条件的 #dailyimpressions。

每日展示次数 = 如果 OutputDF 中的日期在 MediaPlanDF 的开始和结束日期内，则汇总所有符合该条件的 #dailyspend。

这是两个 DF 的示例:

MediaPlanDF(我担心的部分):

#daysinflight   #dailyimpressions   #dailyspend Campaign name   Campaign ID Campaign flight start date  Campaign flight end date
35  392857.1429 1571.428571 A Real Advertiser   RAND0M  8/31/2015   10/4/2015
35  85714.28571 428.5714286 A Real Advertiser   RAND0M  8/31/2015   10/4/2015
35  142857.1429 714.2857143 A Real Advertiser   RAND0M  8/31/2015   10/4/2015
35  62857.14286 942.8571429 A Real Advertiser   RAND0M  8/31/2015   10/4/2015

输出DF

Date
8/31/2015
9/1/2015
9/2/2015
9/3/2015
9/4/2015
9/5/2015
...
10/4/2015

提前感谢您的任何帮助。

我收到此错误:

as.POSIXlt.character(as.character(x), ...) 中的错误:
字符串不是标准的明确格式

这是 dput

structure(list(site = structure(c(1L, 1L, 1L, 1L, 1L, 1L), .Label = c("Accuen", 
"Amazon", "Bleacher Report", "Brightroll", "Buzzfeed", "CBSi", 
"College Humor", "Complex", "ESPN", "GDN", "HULU", "IGN", "Millennial", 
"Nativo", "NBA", "NBC Sports", "Pandora", "Reddit", "Spotify", 
"Tremor", "TrueX", "Twitch", "Wikia", "Woven", "Yahoo!", "YouTube"
), class = "factor"), daysinflight = c(35L, 35L, 35L, 35L, 35L, 
35L), dailyimpressions = c(392857.1429, 85714.28571, 142857.1429, 
62857.14286, 17142.85714, 72380.94286), dailyspend = c(1571.428571, 
428.5714286, 714.2857143, 942.8571429, 428.5714286, 1085.714286
), Campaign.name = structure(c(1L, 1L, 1L, 1L, 1L, 1L), .Label = "A Real Advertiser", class = "factor"), 
    Campaign.ID = structure(c(1L, 1L, 1L, 1L, 1L, 1L), .Label = "RAND0M", class = "factor"), 
    startdate = structure(c(16678, 16678, 16678, 16678, 16678, 
    16678), class = "Date"), enddate = structure(c(16712, 16712, 
    16712, 16712, 16712, 16712), class = "Date"), Campaign.budget = c(5100206L, 
    5100206L, 5100206L, 5100206L, 5100206L, 5100206L), Campaign.planned.cost = c(4663350.2, 
    4663350.2, 4663350.2, 4663350.2, 4663350.2, 4663350.2), Campaign.buy.total = c(4663350.2, 
    4663350.2, 4663350.2, 4663350.2, 4663350.2, 4663350.2), Supplier = structure(c(1L, 
    1L, 1L, 1L, 1L, 1L), .Label = c("ACCUEN", "AMAZON (AMZN MED GP)", 
    "BRIGHTROLL", "BUZZFEED.COM", "CBS DIGITAL MEDIA", "COLLEGE HUMOR", 
    "COMPLEX.COM", "ESPN.COM", "GOOGLE DISPLAY NTWK", "HULU", 
    "IGN.COM", "MILLENNIAL MEDIA", "NATIVO.NET", "NBC.COM", "PANDORA MEDIA, INC.", 
    "REDDIT.COM", "SPOTIFY.COM", "TREMORMEDIA.COM", "TRUEX MEDIA INC.", 
    "TURNER MEDIA GROUP", "TWITCH.TV", "WIKIA.COM", "WOVENDIGITAL.COM", 
    "YAHOO! US", "YOUTUBE, LLC."), class = "factor"), Site = structure(c(1L, 
    1L, 1L, 1L, 1L, 1L), .Label = c("ACCUEN", "AMAZON.COM", "BLEACHER REPORT", 
    "BRIGHTROLL", "BUZZFEED.COM", "CBS INTERACTIVE", "COLLEGEHUMOR", 
    "COMPLEX", "COMPLEX.COM", "ELECTUS", "ESPN.COM", "GOOGLE DISPLAY NTWK", 
    "HULU", "IGN.COM", "MILLENNIAL MEDIA", "NATIVO", "NBA", "NBCSPORTS.COM", 
    "PANDORA", "REDDIT", "SPOTIFY", "TREMOR VIDEO", "TRUEX", 
    "TWITCH", "WIKIA", "WOVEN", "YAHOO", "YOUTUBE, LLC."), class = "factor"), 
    Flight.start.date = structure(c(2L, 2L, 2L, 2L, 2L, 2L), .Label = c("10/3/2015", 
    "8/31/2015", "9/1/2015", "9/10/2015", "9/11/2015", "9/13/2015", 
    "9/14/2015", "9/15/2015", "9/16/2015", "9/17/2015", "9/18/2015", 
    "9/2/2015", "9/20/2015", "9/21/2015", "9/24/2015", "9/25/2015", 
    "9/27/2015", "9/28/2015", "9/7/2015", "9/9/2015"), class = "factor"), 
    Flight.end.date = structure(c(2L, 2L, 2L, 2L, 2L, 2L), .Label = c("10/3/2015", 
    "10/4/2015", "9/11/2015", "9/13/2015", "9/15/2015", "9/17/2015", 
    "9/18/2015", "9/2/2015", "9/20/2015", "9/27/2015", "9/30/2015"
    ), class = "factor"), Cost.method = structure(c(3L, 3L, 3L, 
    3L, 3L, 3L), .Label = c("CPC", "CPE", "CPM", "Flat", "Free"
    ), class = "factor"), Rate = c(43, 15, 5, 125, 25, 15), Planned.unit.amount = c(13750000L, 
    3000000L, 5000000L, 2200000L, 600000L, 2533333L), Cost = c(55000, 
    15000, 25000, 33000, 15000, 38000), Excluded = structure(c(1L, 
    1L, 1L, 1L, 1L, 1L), .Label = "No", class = "factor"), Company.ID = structure(c(1L, 
    1L, 1L, 1L, 1L, 1L), .Label = "skrt", class = "factor"), 
    Person.ID = structure(c(1L, 1L, 1L, 1L, 1L, 1L), .Label = "smgboi", class = "factor"), 
    Exported.by = structure(c(1L, 1L, 1L, 1L, 1L, 1L), .Label = "some guy", class = "factor"), 
    Exported.on = structure(c(1L, 1L, 1L, 1L, 1L, 1L), .Label = "2015-10-06 18:53:12, EDT", class = "factor"), 
    Exported.from = structure(c(1L, 1L, 1L, 1L, 1L, 1L), .Label = "media", class = "factor")), .Names = c("site", 
"daysinflight", "dailyimpressions", "dailyspend", "Campaign.name", 
"Campaign.ID", "startdate", "enddate", "Campaign.budget", "Campaign.planned.cost", 
"Campaign.buy.total", "Supplier", "Site", "Placement.name", "Buy.details", 
"Positioning", "Unit.dimensions", "Flight.start.date", "Flight.end.date", 
"Cost.method", "Rate", "Planned.unit.amount", "Cost", "Excluded", 
"Company.ID", "Person.ID", "Exported.by", "Exported.on", "Exported.from"
), row.names = c(NA, 6L), class = "data.frame")

最佳答案

首先，我们需要确保您的日期格式等是正确的。我会假设它们是，我的版本在最后。您尚未提供 dput并且有一些奇怪的列名，所以仔细检查间距和大写。

接下来，让我们构造一个 interval库中每个事件的对象 lubridate :

library(lubridate)
MediaPlanDF$interval <- interval(MediaPlanDF$Campaign.flight.1, MediaPlanDF$end.date)

现在我们可以测试 outputDF 中的每个项目是否在每个区间中，如果是，则将其求和(您的测试数据包含所有区间中的所有元素):

output <- do.call(rbind, lapply(OutputDF$Date, function(x){
                              index <- x %within% MediaPlanDF$interval;
                              list(impressions = sum(MediaPlanDF$dailyimpressions[index]),
                                   spend = sum(MediaPlanDF$dailyspend[index]))}))

我们在哪里得到输出:

cbind(output, OutputDF)
  impressions    spend       Date
1    684285.7 3657.143 2015-08-31
2    684285.7 3657.143 2015-09-01
3    684285.7 3657.143 2015-09-02
4    684285.7 3657.143 2015-09-03
5    684285.7 3657.143 2015-09-04
6    684285.7 3657.143 2015-09-05

数据:

输出DF:

structure(list(Date = structure(c(16678, 16679, 16680, 16681, 
16682, 16683), class = "Date")), .Names = "Date", row.names = c(NA, 
-6L), class = "data.frame")

媒体计划DF:

structure(list(daysinflight = c(35L, 35L, 35L, 35L), dailyimpressions = c(392857.1429, 
85714.28571, 142857.1429, 62857.14286), dailyspend = c(1571.428571, 
428.5714286, 714.2857143, 942.8571429), Campaign.name = structure(c(1L, 
1L, 1L, 1L), .Label = "A", class = "factor"), Campaign.ID = structure(c(1L, 
1L, 1L, 1L), .Label = "Real", class = "factor"), Campaign.flight = structure(c(1L, 
1L, 1L, 1L), .Label = "Advertiser", class = "factor"), start.date = structure(c(1L, 
1L, 1L, 1L), .Label = "RAND0M", class = "factor"), Campaign.flight.1 = structure(c(16678, 
16678, 16678, 16678), class = "Date"), end.date = structure(c(16712, 
16712, 16712, 16712), class = "Date")), .Names = c("daysinflight", 
"dailyimpressions", "dailyspend", "Campaign.name", "Campaign.ID", 
"Campaign.flight", "start.date", "Campaign.flight.1", "end.date"
), row.names = c(NA, -4L), class = "data.frame")

关于R - 如果日期在范围内，则求和，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33049441/

24

4

0

文章推荐： r - 简单的data.frame reshape

文章推荐： r - 删除 NA 并使用牛津逗号的跨列串联

文章推荐： r - R软件包的最佳许可证是哪种许可证？

OCaml 求和
我正在尝试在 OCaml 中创建一个函数，该函数在数学中执行求和函数。我试过这个: sum n m f = if n = 0 then 0 else if n > m then f
excel - 求和/乘以相同名称附近的每个值
我正在尝试找到一个可以帮助我解决问题的公式。这个公式应该对每个靠近(总是在左边)具有相同名称的单元格的单元格求和(或工作)。如下所示: 将每个大写字母视为 “食谱”并且每个小写字母为 “成分” .在
python - 按日期范围计算变量的累积占用(求和)
让它成为以下 python pandas DataFrame，其中每一行代表一个人在酒店的住宿。 | entry_date | exit_date | days | other_columns
sql 对另一列中特定日期之前的调用次数进行计数/求和
我有显示客户来电的数据。我有客户号码、电话号码(1 个客户可以有多个)、每个语音调用的日期记录以及调用持续时间的列。表看起来如下示例。 CusID | PhoneNum | Date
python - 按日期范围计算变量的累积占用(求和)
让它成为以下 python pandas DataFrame，其中每一行代表一个人在酒店的住宿。 | entry_date | exit_date | days | other_columns
如果年份等于，Excel 求和
我得到了两列数据；答: 2013年12月31日 2013年12月30日 2013年12月29日 2013年12月28日 2013年12月27日 2012年12月26日 B: 10 10 10 10
C - double 求和
我对 double 格式的精度有疑问。示例: double K=0, L=0, M=0; scanf("%lf %lf %lf", &K, &L, &M); if((K+L) 我的测试输入: K
c# - 求和、减法和乘法数组
我有以下数组: int[,] myArray1 = new int[2, 3] { { 1, 2, 3 }, { 4, 6, 8 } }; int[,] myArray2 = new int[2, 3
mysql - 左连接和条件 where 求和
我需要有关报告查询的帮助。我在该方案的底部有一个发票表，需要一种方法来获取总计费金额，同时在此数据库方案中的较高点进行条件过滤。我需要加入其他表，这会导致 SUM 函数返回不需要的结果。这是我正在使
mysql - 求和/格查询的最佳索引策略
我有一个使用innodb作为存储引擎的MySQL数据库，并且我有许多采用基本形式的查询： SELECT bd.billing, SUM(CASE WHEN tc.transaction_class
mysql - 在mysql中使用case和limit对结果进行计数/求和
尝试创建一个查询来给出总胜、平和负。我有以下查询 SELECT CASE WHEN m.home_team = '192' AND m.home_full_time_score
MYSQL 双连接表和不准确的计数/求和
我正在尝试生成一份报告，显示排名靠前的推荐人以及他们推荐的人产生了多少收入。这是我的表格的缩写版本: Users Table ------------------ id referral_user_
mysql - 对查询中的多个 IF 求和
我有以下查询，并得到了预期的结果: SELECT IF (a1>b1,'1','0') AS a1r, IF (a2>b2,'1','0') AS a2r,
mysql - 任意字段分组/求和
我尝试了几种不同的解决方案，但都没有成功。我给出的表格是一个示例，其设计和功能与我实际使用的表格类似: PK | Color | Count -------------------
mysql 多重计数并与 WHERE 求和
我正在尝试构建一个查询来检查我的库存。 SELECT COUNT(*) AS item_count, reseller_id, sum(sold) as sold_count, sum(refunde
mysql - 对具有相同列值的值进行分组/求和
我试图解决一个看起来像下面编写的代码的问题，但由于缺乏知识和阅读 sqlalchemy 文档，我还没有真正找到解决问题的方法。目标: 如果 year_column 中的年份相同，则获取 sales_
MySQL - 求和，但前提是所有条件都满足
我有一个包含一周中多天的表格。一周中的每一天都有独特的属性，例如冰淇淋是否在这一天成功送达: ID DAY_WEEK ICE_CREAM 1 Monday
具有相同引用编号的 PHP 求和
首先，我有一个名为store_00的表 id | ref | item | qty | cost | sell 1 22 x1 5 10 15 2 22
c++ - MPI(求和)
我正在编写一个程序，计算每个数字的总和，直到 1000。例如，1+2+3+4+5....+100。首先，我将求和作业分配给 10 个处理器:处理器 0 得到 1-100，处理器 1 得到 101-20
python - 如何通过一次循环对多个对象属性求和(求和)？
我想在一个循环中一次对多个属性求和: class Some(object): def __init__(self, acounter, bcounter): self.acou

首页

博学

6Ren·AI

商城

R - 如果日期在范围内，则求和