gpt4 book ai didi

r - 机器学习的数据转换

转载 作者:行者123 更新时间:2023-12-01 08:52:56 26 4
gpt4 key购买 nike

我有包含 SKU ID 及其计数的数据集,我需要将此数据输入机器学习算法,以使 SKU ID 成为列并且 COUNTs 位于事务 ID 和 SKU ID 的交集处。任何人都可以建议如何实现这种转变。

当前数据

TransID     SKUID      COUNT
1 31 1
1 32 2
1 33 1
2 31 2
2 34 -1

所需数据

TransID      31      32      33      34
1 1 2 1 0
2 2 0 0 -1

最佳答案

R 中,我们可以使用 xtabs

xtabs(COUNT~., df1)
# SKUID
#TransID 31 32 33 34
# 1 1 2 1 0
# 2 2 0 0 -1

dcast

library(reshape2)
dcast(df1, TransID~SKUID, value.var="COUNT", fill=0)
# TransID 31 32 33 34
#1 1 1 2 1 0
#2 2 2 0 0 -1

传播

library(tidyr)
spread(df1, SKUID, COUNT, fill=0)

关于r - 机器学习的数据转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36806745/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com