- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个包含 10 万多行和约 200 列的 dplyr
数据框。大约有 15 列包含 Excel 格式的日期值(自 1900 年 1 月 1 日以来的天数),它们的列名称包含 date
字符串,这使得对数据帧进行子集化变得相当容易。
library(dplyr)
x <- data.frame(date1 = 45000+ 500*rnorm(100),
date2 = 50000+ 500*rnorm(100),
var1 = 50 * rnorm(100),
var2 = 100 + 20 * rnorm(100))
> x %>% head
date1 date2 var1 var2
1 44952.83 49432.88 8.125523 125.95802
2 44331.47 49231.76 -34.814162 117.26881
3 44597.69 49651.91 27.747881 108.45787
4 45113.50 49802.87 24.584569 83.84904
5 46212.14 49972.59 72.444414 80.61595
6 45753.38 50074.57 -34.927552 127.70018
date_cols <- x %>% select(contains('date', ignore.case=T)) %>% names
> date_cols
[1] "date1" "date2"
我想将这些日期列更改为实际的 R
日期时间,而不更改其他列。我只是不知道如何仅更新数据帧的 date_cols
子集:
x %>% select_(.dots = date_cols) %>%
mutate_each(funs(as.Date(., origin="1900-01-01"))) %>%
head
date1 date2
1 2023-01-28 2035-05-05
2 2021-05-17 2034-10-16
3 2022-02-07 2035-12-10
4 2023-07-08 2036-05-09
5 2026-07-11 2036-10-26
6 2025-04-08 2037-02-05
我尝试了以下方法,但不起作用:
x %>% select_(.dots = date_cols) <- x %>% select_(.dots = date_cols) %>%
mutate_each(funs(as.Date(., origin="1900-01-01")))
我想有一种更好的方法可以“重新绑定(bind)”原始数据帧,而无需日期列与 date_cols
子集一旦发生突变。
最佳答案
正如 @alistaire 所评论的,您可以使用 mutate_at
仅转换那些 date
列,并保持其余数据帧不变,这样就可以避免绑定(bind)原始数据带有子集的数据框:
library(dplyr)
muX <- x %>% mutate_at(vars(contains('date')), funs(as.Date(., origin="1900-01-01")))
head(muX)
# date1 date2 var1 var2
# 1 2021-11-09 2038-10-20 44.524710 86.15957
# 2 2020-06-04 2037-08-04 31.402905 94.74633
# 3 2023-12-22 2038-03-06 31.600929 85.90605
# 4 2020-05-08 2037-01-02 7.140777 82.80565
# 5 2025-03-25 2038-07-30 -54.913577 100.83949
# 6 2021-02-18 2034-06-20 28.616670 93.92246
并且根据?mutate_at
:
summarise_each() and mutate_each() are older variants that will be deprecated in the future.
更好地习惯这些新的 API。
关于r - 使用 mutate_each 更新 df 的子集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38223846/
我使用 tidyverse 包中的函数 mutate_each,但收到一条消息,该函数已被弃用。我想使用其他未弃用的函数来更改字段类型。 下面是我目前如何使用 mutate_each 的可重现示例。
我对使用 mutate_each 将 function 应用到我的 data.frame 有疑问 我有一个函数可以计算两个波 y1 和 y2 之间的相移。我想将此函数应用于我的数据并创建名为 phas
我想通过 dplyr::mutate_each 对所有列应用转换,例如 library(dplyr) mult % mutate_each(funs(mult(.,2))) # Multiply
我想将几列中每一列中的所有值设置为NA。通常,如果我想使用相同的算法修改多个列,我会使用 dplyr 中的 mutate_each 。从算法的角度来看,函数“x 映射到 null”似乎定义得很明确,所
有没有办法使用dplyr::mutate_each实现下面的转换? data.frame(x1 = 1:5, x2 = 6:10, y1 = rnorm(5), y2 = rnorm(5)) %>%
我正在解决 sparklyr 中的集群问题。训练集中的许多变量是在不同的尺度上测量的,因此存在数量级的差异。根据最佳实践,我正在尝试扩展和集中数据。 有许多不同的公式可以做到这一点,最传统的是 (X
我使用 dplyr包裹在 R .使用我想创建一个函数 require(dplyr) aFunction % mutate_each(funs(aFunction(., ...))) } 然后称之为 d
我尝试将 dplyr::mutate_each 与一些外部函数一起使用,而不附加实际的库 dplyr::tbl_df(iris) %>% dplyr::mutate_each(dplyr::f
在这种情况下,我尝试将 quantile 函数应用于此示例数据框: DF % mutate_each(funs(quantile(DF,c(0.98), na.rm=TRUE))) 但是 muta
我想在对 summarize_each 的调用中使用匿名函数: # how to use an anonymous function in dplyr df_foo = data_frame(x =
我有一个数据框,其中第一列作为分类标识符,第二列作为频率值,其余列作为原始数据计数。我想将所有计数列乘以频率列,但不是前两列。 所有原始计数列均以大写字母开头,后跟句号,例如“L.abd”、T.xyz
我有一个包含 10 万多行和约 200 列的 dplyr 数据框。大约有 15 列包含 Excel 格式的日期值(自 1900 年 1 月 1 日以来的天数),它们的列名称包含 date 字符串,这使
这个问题已经有答案了: Using anonymous functions with summarize_each or mutate_each (1 个回答) 已关闭 5 年前。 众所周知,可以调用
我有一个名为 test 的小数据集,我想在其中对向量 cm 中定义的列执行一些变异操作。 安装和加载一些包 require(devtools) devtools::install_github("
我有这样一个数据框 Letter Number1 Number2 Number3 Type A 4 5 3 10 B 10
我在这里有点沮丧......所以我有一个数据集需要缩放变量。我有超过 44 个变量,但意识到对所有变量的操作次数可能消耗了太多内存(不太可能,因为我有 8 Gb RAM,但我不知道)。 当我执行以下
以下面的例子为例。 library(dplyr) temp % mutate_each(funs(mean, median)) 检查 temp_each 的名称,我们看到 > names(te
尝试解决时 this problem我遇到了 mutate_each 的问题的 dplyr .我想在函数中使用它并将参数传递给它。 funs()成功但不适用于 matches() . 让我展示一个简单
我最近遇到了 dplyr 并且 - 作为一个新手 - 非常喜欢它。因此,我尝试将我的一些 base-R 代码转换为 dplyr 代码。 在处理空中交通管制数据时,我正在努力使用 lubridate 和
在 Python Pandas 中,我想通过在多个列上执行多个聚合函数来添加列,例如 R dplyr mutate_each。比如Python Pandas能否实现和下面R脚本一样的处理? R dpl
我是一名优秀的程序员,十分优秀!