gpt4 book ai didi

r - 使用具有重复标识符的 data.frame/tibble 进行传播

转载 作者:行者123 更新时间:2023-12-03 07:41:54 24 4
gpt4 key购买 nike

tidyr 的文档表明收集和传播是可传递的,但以下带有“iris”数据的示例表明它们不是可传递的,但尚不清楚原因。任何澄清将不胜感激

iris.df = as.data.frame(iris)
long.iris.df = iris.df %>% gather(key = feature.measure, value = size, -Species)
w.iris.df = long.iris.df %>% spread(key = feature.measure, value = size, -Species)

我期望数据帧“w.iris.df”与“iris.df”相同,但收到以下错误:

"Error: Duplicate identifiers for rows (1, 2, 3, 4, 5, 6, 7, 8, 9..."

我的一般问题是如何在此类数据集上反转“收集”的应用。

最佳答案

Hadley 的干预出乎意料地完美……但在那之后我最终对语法进行了一些修改……因此,为了它的值(value),我发布了完全可操作的代码(抱歉,我的语法与上面有点不同):

library(tidyr)
library(dplyr)

wide <-
iris %>%
mutate(row = row_number()) %>%
gather(vars, val, -Species, -row) %>%
spread(vars, val)

head(wide)
# Species row Petal.Length Petal.Width Sepal.Length Sepal.Width
# 1 setosa 1 1.4 0.2 5.1 3.5
# 2 setosa 2 1.4 0.2 4.9 3.0
# 3 setosa 3 1.3 0.2 4.7 3.2
# 4 setosa 4 1.5 0.2 4.6 3.1
# 5 setosa 5 1.4 0.2 5.0 3.6
# 6 setosa 6 1.7 0.4 5.4 3.9

head(iris)
# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
# 1 5.1 3.5 1.4 0.2 setosa
# 2 4.9 3.0 1.4 0.2 setosa
# 3 4.7 3.2 1.3 0.2 setosa
# 4 4.6 3.1 1.5 0.2 setosa
# 5 5.0 3.6 1.4 0.2 setosa
# 6 5.4 3.9 1.7 0.4 setosa

它们是相同的......只是需要重新排序,如果你愿意......

wide <- wide[,c(3, 4, 5, 6, 1)]  ## Reorder and then remove "row" column

完成。

关于r - 使用具有重复标识符的 data.frame/tibble 进行传播,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25960394/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com