gpt4 book ai didi

R计算数据帧每一行中的字符串变量

转载 作者:行者123 更新时间:2023-12-01 10:22:25 25 4
gpt4 key购买 nike

我有一个看起来像这样的数据框,其中每一行代表一个样本,并且重复相同的字符串

> df
V1 V2 V3 V4 V5
1 a a d d b
2 c a b d a
3 d b a a b
4 d d a b c
5 c a d c c

我希望能够创建一个新的数据框,理想情况下,标题是前一个数据框(a、b、c、d)中的字符串变量,每行的内容是每个字符串的出现次数相应的变量来自原始数据框。使用上面的示例,这看起来像

> df2
a b c d
1 2 1 0 2
2 2 1 1 1
3 2 1 0 1
4 1 1 1 2
5 1 0 3 1

在我的实际数据集中,有数百个变量和数千个样本,因此如果我可以自动从原始数据框中提取名称,并将它们按字母顺序排列到新数据框的标题中,那将是理想的选择。

最佳答案

你可以试试

library(qdapTools)
mtabulate(as.data.frame(t(df)))

或者

mtabulate(split(as.matrix(df), row(df)))

或者使用base R

Un1 <- sort(unique(unlist(df)))
t(apply(df ,1, function(x) table(factor(x, levels=Un1))))

关于R计算数据帧每一行中的字符串变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30007287/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com