r - 选择数据 - 第一个条目 + 设置时间段(1 年)R-6ren

r - 选择数据 - 第一个条目 + 设置时间段(1 年)R

转载作者：行者123 更新时间：2023-12-02 18:04:06

33

4

我有一个关于一组个人的数据集，该数据集是在每个人的不同时间开始收集的。

我需要对自第一次输入以来一年内的数据进行子集化，如下所示:myData[myDate >= "first entry" & myDate += "1 year"]

示例数据:

df_date <- data.frame( Name = c("Jim","Jim","Jim","Jim","Jim","Jim","Jim","Jim","Jim","Jim","Jim","Jim","Jim","Jim",
                                "Sue","Sue","Sue","Sue","Sue","Sue","Sue","Sue","Sue","Sue","Sue","Sue","Sue","Sue"),
                       Dates = c("2010-1-1", "2010-2-2", "2010-3-5","2010-4-17","2010-5-20",
                                 "2010-6-29","2010-7-6","2010-8-9","2010-9-16","2010-10-28","2010-11-16","2010-12-28","2011-1-16","2011-2-28",
                                 "2010-4-1", "2010-5-2", "2010-6-5","2010-7-17","2010-8-20",
                                 "2010-9-29","2010-10-6","2010-11-9","2012-12-16","2011-1-28","2011-2-28","2011-3-28","2011-2-28","2011-3-28"),
                       Event = c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1) )

所需的输出是 Jim 将从 1/1/2010 - 12/28/2010 获取数据和苏来自 4/4/2010 - 3/28/2011等等。实际数据集有超过 20 个样本，全部在不同时间开始。

最佳答案

结合使用 tidyverse 和 lubridate 函数:

library(tidyverse)
library(lubridate)

df_date %>%
  mutate(Dates = as_datetime(Dates)) %>%
  group_by(Name) %>%
  arrange(Dates, .by_group = T) %>%
  filter(Dates <= first(Dates) + duration(1, units = "year"))

关于r - 选择数据 - 第一个条目 + 设置时间段(1 年)R，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/73704912/

33

4

0

文章推荐： reactjs - 嵌套路由不起作用( react 路由器 v6)

Java 时间段(十进制年数)
如果我使用以下方法计算 java.time 中 2 个 LocalDate 之间的差异: Period p = Period.between(testDate, today); 然后我得到一个包含年、
sql - 表示日期/时间段
我正在开发一个有多种不同费率的预订平台。这些费率由一天中的时间、星期几和一年中的一天决定。以下是所涉及的间隔类型的一些示例: 周一至周五，上午 9 点至下午 5 点周六和周日，中午 12 点到早上
r - 时间段 R 的条件总和
我有大量数据，包括开始时间、停止时间和值。开始和停止时间因行而异，以 5 分钟为增量。我正在尝试创建一个新的数据框，该数据框具有 5 分钟的间隔以及该间隔在行的开始和停止范围内的所有行的总和。我有一
mysql - 时间段 SQL 查询
我有一个这样的表: --------------------------------------------- |Id | Step | StartedAt
两个日期之间的 C# 时间段(以周为单位)
我有一个网络应用程序，用户将在其中输入 2 个日期。一个 StartDate 和一个 EndDate。现在我想编写它，以便在选择 StartDate 和 EndDate 时确定有多少周，然后显示这些周
java - 如何比较两个 Joda 时间段
这看起来并不直截了当。我正在尝试: @Override public int compare(Period o1, Period o2) { return o1.toStandardDays
php - iCal 不显示组织者的 session 时间段
我必须为团队发送 session 邀请，这是我的邮件 $ical = 'BEGIN:VCALENDAR PRODID:-//Microsoft Corporation//Outlook 11.0
php - DateInterval 不接受以毫秒为单位的 ISO 8601 时间段
我有这个 ISO 8601 时间段字符串: P0Y0M0DT3H5M0.000S 并且 PHP7.4 无法用它构造 DateInterval。 format('%h Hours %m Minutes
time - LibreOffice SUM 时间段，格式为 HH :MM:SS
我想要获取包含一段时间(格式为 HH:MM:SS)的多个单元格的总和。在 LibreOffice Calc 4.0.3.3 中，我复制粘贴了 G14:G21 范围内的时间段，并将单元格格式设置为时间
mysql - SELECT/GROUP BY - 时间段(10 秒、30 秒等)
我有一个表(MySQL)，每n秒捕获一次样本。该表有很多列，但重要的是两列:时间戳(TIMESTAMP 类型)和计数(INT 类型)。我想做的是获取一定时间范围内计数列的总和和平均值。例如，我每 2
mysql - SELECT/GROUP BY - 时间段(10 秒、30 秒等)
我有一个表(MySQL)，每n秒捕获一次样本。该表有很多列，但重要的是两列:时间戳(TIMESTAMP 类型)和计数(INT 类型)。我想做的是获取一定时间范围内计数列的总和和平均值。例如，我每 2
java - 使用 Joda-Time PeriodFormatter 显示 "negative"时间段
我在一个项目上使用 joda-time (1.6.2)，我正在做的其中一件事就是计算预测时间和实际时间之间的差异。这种差异有时是积极的，有时是消极的。虽然适当的方法可能是使用 Duration 而不是
mysql - SELECT/GROUP BY - 时间段(10 秒、30 秒等)
我有一个表 (MySQL)，它每 n 秒捕获一次样本。该表有很多列，但最重要的是两列:一个时间戳(TIMESTAMP 类型)和一个计数(INT 类型)。我想做的是获取计数列在一段时间内的总和和平均值
date-range - 如何在 Google Data Studio 中创建 'past 3 months' 时间段
我想让我的折线图显示过去 3 个月的数据。 GDS 有一个“最后一个季度”的日期范围，但这显示的是 Q1、Q2、Q3 或 Q4。我需要的是过去3个整月(不算当月)的数据。我尝试创建一个计算字段，但事实
date-range - 如何在 Google Data Studio 中创建 'past 3 months' 时间段
我想让我的折线图显示过去 3 个月的数据。 GDS 有一个“最后一个季度”的日期范围，但这显示的是 Q1、Q2、Q3 或 Q4。我需要的是过去3个整月(不算当月)的数据。我尝试创建一个计算字段，但事实

首页

博学

6Ren·AI

商城

r - 选择数据 - 第一个条目 + 设置时间段(1 年)R