gpt4 book ai didi

使用重复列 reshape 数据

转载 作者:行者123 更新时间:2023-12-04 17:54:55 26 4
gpt4 key购买 nike

我正在尝试使用 reshape 来重组我的数据集。

这是我的数据的一个子集,它是一个 16 X 198 的数据框。每个奇数列是一个 16 年的列表,偶数列具有不同国家/地区的值。

   Algeria.x Algeria.y Argentina.x Argentina.y
1 1985 37.48 1985 27.86
2 1986 36.26 1986 27.52
3 1987 35.04 1987 27.18
4 1988 33.82 1988 26.84
5 1989 32.60 1989 26.50
6 1990 NA 1990 25.50
7 1991 NA 1991 24.50
8 1992 NA 1992 23.50
9 1993 NA 1993 22.50
10 1994 NA 1994 21.50
11 1995 NA 1995 22.12
12 1996 NA 1996 22.74
13 1997 NA 1997 23.36
14 1998 NA 1998 23.98
15 1999 NA 1999 24.60
16 2000 NA 2000 NA

我想 reshape 数据,使其具有三列。第一个是国名,第二个是年份,第三个是值。这将是一个 1584 x 3 的长矩阵。

最佳答案

我会使用 stack在将数据拆分为两个 data.frames 后,函数两次:一个用于年份,另一个用于值:

# split the data into two data.frames
years.df <- df[, seq(from = 1, to = ncol(df), by = 2)]
values.df <- df[, seq(from = 2, to = ncol(df), by = 2)]

# remove ".x" and ".y" at the end of the country names
names(years.df) <- sub("\\.x$", "", names(years.df))
names(values.df) <- sub("\\.y$", "", names(values.df))

# stack each data.frame into a two-column data.frame
years.stack <- stack(years.df)
values.stack <- stack(values.df)

# gather everything into a single data.frame
final.df <- data.frame(country = years.stack$ind,
year = years.stack$value,
value = values.stack$value)
final.df
# country year value
# 1 Algeria 1985 37.48
# 2 Algeria 1986 36.26
# 3 Algeria 1987 35.04
# 4 Algeria 1988 33.82
# 5 Algeria 1989 32.60
# 6 Algeria 1990 NA
# 7 Algeria 1991 NA
# 8 Algeria 1992 NA
# 9 Algeria 1993 NA
# 10 Algeria 1994 NA
# 11 Algeria 1995 NA
# 12 Algeria 1996 NA
# 13 Algeria 1997 NA
# 14 Algeria 1998 NA
# 15 Algeria 1999 NA
# 16 Algeria 2000 NA
# 17 Argentina 1985 27.86
# 18 Argentina 1986 27.52
# 19 Argentina 1987 27.18
# 20 Argentina 1988 26.84
# 21 Argentina 1989 26.50
# 22 Argentina 1990 25.50
# 23 Argentina 1991 24.50
# 24 Argentina 1992 23.50
# 25 Argentina 1993 22.50
# 26 Argentina 1994 21.50
# 27 Argentina 1995 22.12
# 28 Argentina 1996 22.74
# 29 Argentina 1997 23.36
# 30 Argentina 1998 23.98
# 31 Argentina 1999 24.60
# 32 Argentina 2000 NA

关于使用重复列 reshape 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9847230/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com