gpt4 book ai didi

R data.table 一次 reshape 大块的列

转载 作者:行者123 更新时间:2023-12-02 04:54:00 24 4
gpt4 key购买 nike

假设我有一个包含这些列的data.table

nodeID   
hour1aaa
hour1bbb
hour1ccc
hour2aaa
hour2bbb
hour2ccc
...
hour24aaa
hour24bbb
hour24ccc

总共有 72 列。我们称它为 rawtable

我想 reshape 它所以我有

nodeID
hour
aaa
bbb
ccc

总共只有这 5 列其中小时列将包含原始 72 中的任何一个小时。我们称它为 newshape

我现在使用的方法是使用包含 24 个项目的 rbindlist,其中每个项目都是更大 data.table 的适当子集。像这样(除了我在示例中省略了大部分时间)

newshape<-rbindlist(list(
rawtable[,list(nodeID, Hour=1, aaa=hour1aaa, bbb=hour1bbb, ccc=hour1ccc)],
rawtable[,list(nodeID, Hour=2, aaa=hour2aaa, bbb=hour2bbb, ccc=hour2ccc)],
rawtable[,list(nodeID, Hour=24, aaa=hour24aaa, bbb=hour24bbb, ccc=hour24ccc)]))

这里有一些示例数据可以使用

rawtable<-data.table(nodeID=c(1,2),hour1aaa=c(12.4,32),hour1bbb=c(61.1,65.33),hour1ccc=c(-4.2,54),hour2aaa=c(12.2,1.2),hour2bbb=c(12.2,5.7),hour2ccc=c(5.6,101.9),hour24aaa=c(45.2,8.5),hour24bbb=c(23,7.9),hour24ccc=c(98,32.3))

使用我的 rbindlist 方法可以得到预期的结果,但是,就像我用 R 做的大多数事情一样,可能有更好的方法。更好的意思是内存效率更高、速度更快和/或使用更少的代码行。有没有人有更好的方法来实现这一目标?

最佳答案

这是一个经典的 reshape 问题,如果你按照它期望的标准约定获得你的名字,虽然我不确定这是否真的利用了 data.table 的效率> 结构:

reshape(
setNames(rawtable, gsub("(\\D+)(\\d+)(\\D+)", "\\3.\\2", names(rawtable))),
idvar="nodeID", direction="long", varying=-1
)

结果:

   nodeID hour  aaa   bbb   ccc
1: 1 1 12.4 61.10 -4.2
2: 2 1 32.0 65.33 54.0
3: 1 2 12.2 12.20 5.6
4: 2 2 1.2 5.70 101.9
5: 1 24 45.2 23.00 98.0
6: 2 24 8.5 7.90 32.3

@Arun 的回答在这里:https://stackoverflow.com/a/15510828/496803如果您可以根据当前数据对其进行调整,也可能会有用。

关于R data.table 一次 reshape 大块的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18324585/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com