R 从数据帧 : by date with repeated factors 中选择-6ren

R 从数据帧 : by date with repeated factors 中选择

转载作者：行者123 更新时间：2023-12-03 20:38:55

24

4

我有一个地址和销售日期的数据框。一些地址有多个条目。我想要一个新的数据框，每个地址只有一次，并且要在最近的日期之前选择该地址。这是数据框的片段。

df <-structure(list(address = c("2", "316", "647", "6904", "# 5 BENT TREE DR", "# 62 62000 E 440 PL", "# 7 BENT TREE DR", "#1 ARROWHEAD RD", "#1 ECHO DR", "#1 JACKS HIDEAWAY", "#1 JACKS HIDEAWAY", "#1 MARINA DR", "#1 WHITE CHAPEL", "#10 JACKS HIDEAWAY", "#10 PRIVATEER", "#10 SUMMERSIDE", "#102 THE MOORS", "#103 MOORS VIEW", "#108 THE MOORS", "#111 THE MOORS", "#112 THE MOORS", "#116 THE MOORS", "#12 DOGWOOD HOLLOW", "#12 MAINSTAY", "#120 THE MOORS", "#13 DOGWOOD HOLLOW", "#13 MEGHAN COVES", "#14 BEACON HILL", "#14 GRAND JEST", "#14 GRAND JEST"), sold = structure(c(13521, 11373, 13413, 14372, 15044, 14056, 15044, 12712, 12671, 12524, 11071, 11856, 11670, 11754, 12251, 11829, 11465, 12600, 11271, 11624, 11831, 11276, 12724, 14040, 11100, 12678, 12174, 12293, 14546, 11430), class = "Date")), .Names = c("address", "sold"), class = "data.frame", row.names = c(NA, 30L))
df

例如，如果

address       date
123 Main St   2002-03-01 
123 Main St   2005-01-01

我只想要新数据框中 123 Main St 的 2005 年日期线。

我尝试了 dplyr 的一些功能

library(plyr)
library(dplyr)

> df %>% group_by(address) %>% max(df$sold)
Error in FUN(X[[i]], ...) : 
  only defined on a data frame with all numeric variables
> df %>% group_by(address) %>% max(as.numeric(.(sold)))
Error in function_list[[k]](value) : 
  (list) object cannot be coerced to type 'double'

> ddply(df, .(address), max(.(sold)))
Error in max(.(sold)) : invalid 'type' (list) of argument

我不知道从这里该做什么，如果能提供一种选择新数据框的方法，我将不胜感激。

最佳答案

我们可以按降序排列 'sold' 列，并在按 'address' 分组后使用 slice 选择第一个观察值。

library(dplyr)
df %>%
    group_by(address)  %>% 
    arrange(desc(sold)) %>%
    slice(1)

或者获取'sold'最大值的索引(which.sold)并在我们按'address'分组后使用slice获取该行

df %>%
   group_by(address)  %>%
   slice(which.max(sold))

或者另一种选择是使用 top_n。

df %>%
   group_by(address) %>% 
   top_n(1)

或者如果我们正在使用 data.table，我们将 'data.frame' 转换为 'data.table' (setDT(df))，命令 ' sold' 降序排列，并使用 unique 和 by 选项为每个“地址”选择第一个观察值。

library(data.table)
unique(setDT(df)[order(-sold)], by = 'address')

关于R 从数据帧 : by date with repeated factors 中选择，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35206978/

24

4

0

文章推荐： java - Googleapis.com 未知主机异常

文章推荐： java - 如何调试部署在 jar 文件中的 stub 类？

文章推荐： java - 如何使用 hawtio 在 Java 项目中监控 Apache Camel 路线

文章推荐： python - python中的这个溢出错误是什么意思？

date - 如何计算pyspark数据帧中DateType的Max(Date)和Min(Date)？
数据框有一个字符串类型的日期列 '2017-01-01' 它被转换为 DateType() df = df.withColumn('date', col('date_string').cast(Dat
javascript - date && new Date(date) 在做什么？
这个问题在这里已经有了答案: What is "x && foo()"? (5 个答案) 关闭 8 年前。我在 bootstrap-datepicker.js 文件中遇到过这个。作者在_setD
Javascript date(string date) - date() 无法显示正确的差异
我有一个数据库 utc 字符串，我正在传递到 Date(attrs.endDate)，然后通过 new Date() 减去当前的 utc 日期，但我无法得到它来为我提供 2 个 utc 日期的正确差异
javascript - 为什么 (new Date() == new Date()) 为假，而 (Date() == Date()) 为真？
这个问题在这里已经有了答案: how to determine if 2 dates object equals each other? [duplicate] (3 个答案) 关闭 6 年前。我
JavaScript Date 作为对象接收，就像这次旅行。Date : "/Date(1426530600000)/"
这个问题已经有答案了: How can I convert "/Date(1399739515000)/" into date format in JavaScript? (3 个回答) 已关闭 8
javascript - 将 Date 实例传递给 Date 构造函数以克隆 Dates
根据MDN ，我们只能将以下类型的参数传递给 Date 构造函数: new Date(); new Date(value); // Unix timestamp new Date(dateString
php - Eloquent - Where Date >= date(now) and whereNull ('date' )
我从表中获取所有项目: endDate >= 现在 endDate 为 NULL published 等于 1。这是我所拥有的，但它给了我 0 个项目: $items = Items::orderB
mysql - 当我从 >= DATE 切换到 BETWEEN DATE and DATE 时，为什么此查询花费的时间如此之长？
此查询需要很长时间才能完成。当我将 WHERE 子句设置为 new_dl >= '2014-01-01' 时，查询大约需要 6 分钟才能浏览大约 3 个月的数据。现在不知道为什么这个应该从 12 个月
java - date = date + part 与 date.concat(part)
我有一个正在为项目开发的小型 Java 程序，它使用 JavaMail 从指定的 URI 中提取用户的收件箱，然后开始处理消息。在 Outlook 中，属性菜单中有一个功能可以设置邮件的到期日期，它
javascript - 格式化 Date.getHours()、Date.getMinutes()、Date.getSeconds()
我想在获取 Date.getHours()、Date.getMinutes() 和 Date.getSeconds() 的值后格式化输出>. 这是一条漫长的路: var dt = new Date()
java - Date.format(Date) 与 Date.format(Object)
我发现java.text.DateFormat有两种格式化日期的方法。一种是采用 Date 参数，另一种是采用 Object 参数。我检查了DateFormat源代码，似乎他们调用了不同的内部方法。
java - Java Date 构造函数 Date(long date) 有什么问题？
我有两个对象，p4 和 p5，它们都具有 Date 属性。在某些时候，构造函数工作正常: p4.setClickDate(new Date(System.currentTimeMillis() - 8
node.js - Sequelize $gt date 转换为 = date 而不是 > date
我是使用 Sequelize 和 Node.js 的新手，但我的代码中存在日期比较问题。 User.findOne({ where: { resetToken: passwordToken,
javascript - 使用 $format Date = $.PHP Date ("U", date) 转换为时区；
我正在使用一个名为 fullcalendar 的 jquery 日历。当用户单击某一天时，他们将被发送到另一个页面以创建该天的事件。单击的日期作为 date 提供。然后通过下面的函数运行将其转换为 U
python - 试图将日期列表放入 date.year、date.month、date.day 中进行比较？
我有一个列表列表，每个列表中都有整数值，代表 8 年期间的日期。 dates = [[2014, 11, 14], [2014, 11, 13], ....., [2013, 12, 01]
c# - GroupJoin by date where date in second list between two dates from first
我有两个表: 首先是TimeValues(示例) time | value 12/28/18 | 5.6 01/03/19 | 5.6 01/04/19 | 5.6 01/09/19 | 5.
date - 如何将 go 中的 DATE 转换为 salesforce 中的数据类型 DATE
关闭。这个问题需要debugging details .它目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and th
javascript Date 为什么 Date new Date ("2011-12-13") 被认为是星期一而不是星期二？
像这样实例化的日期对象: new Date("2011-12-13") 返回一个认为自己是星期一的日期对象: Date {Mon Dec 12 2011 16:00:00 GMT-0800 (PST)
MySQL : How to select record where begin date and end date between two dates of mysql
我需要选择入住日期和退房日期在指定日期范围之间的房价。这些费率根据其条件单独命名。房费取决于所选日期。这是我的代码: rate_eb rate_name rate_starts rat
Swift - Calendar date 1 inSameDayAs date 2 for dates timestamps 返回只有一个日期的数组和重复多少次
我有 [Int64:[String:String]] 其中 Int64 是时间戳。如何检测和删除 [String:String] 中的参数之一是 ["name"] = "test" 并重复多次的同一天

首页

博学

6Ren·AI

商城

R 从数据帧 : by date with repeated factors 中选择