gpt4 book ai didi

r - 使用 tidyr,当传播值获得 NA

转载 作者:行者123 更新时间:2023-12-05 05:08:55 29 4
gpt4 key购买 nike

我有一个问题,我已经使用 tidyr 尝试转换数据,从长到宽,从宽到长。收集、联合等所有功能都可以正常工作,但是当我应用传播时,我得到了正确的格式,但很大一部分值变成了 NA。我无法上传此数据。你知道为什么会变成这样吗?我能做些什么?

最佳答案

一个常见的错误(我也犯过)是,在应用函数 spread 时,数据中仍有一列对于每个预期的行来说都不相同。

一个例子:

数据

df <- data.frame(id = rep(1:5,2),
g = rep(1:2,5),
gname = rep(letters[1:2],5),
x1 = letters[1:10],
x2 = letters[11:20])

代码

df %>%
gather(key,value,-id,-g,-gname) %>%
unite(dummy,key,g) %>%
spread(dummy,value)

结果

# A tibble: 10 x 6
id gname x1_1 x1_2 x2_1 x2_2
<int> <fct> <chr> <chr> <chr> <chr>
1 1 a a NA k NA
2 1 b NA f NA p
3 2 a g NA q NA
4 2 b NA b NA l
5 3 a c NA m NA
6 3 b NA h NA r
7 4 a i NA s NA
8 4 b NA d NA n
9 5 a e NA o NA
10 5 b NA j NA t

因为 gname 在使用 spread 之前留在数据中,所以出错了。

所以如下:

df %>%
gather(key,value,-id,-g,-gname) %>%
unite(dummy,key,g) %>%
select(-gname) %>%
spread(dummy,value)

给出正确的结果:

  id x1_1 x1_2 x2_1 x2_2
1 1 a f k p
2 2 g b q l
3 3 c h m r
4 4 i d s n
5 5 e j o t

关于r - 使用 tidyr,当传播值获得 NA,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57970500/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com