gpt4 book ai didi

r - 连接两列的因子水平

转载 作者:行者123 更新时间:2023-12-04 00:48:31 24 4
gpt4 key购买 nike

我有 2 列具有相同类型数据(字符串)的数据。

我想加入列的级别。 IE。我们有:

col1   col2
Bob John
Tom Bob
Frank Jane
Jim Bob
Tom Bob
... ... (and so on)

现在 col1 有 4 个级别(Bob、Tom Frank、Jim)而 col2 有 3 个级别(John、Jane、Bob)

但我希望两列都具有所有因子级别(Bob、Tom、Frank、Jim、Jane、John),以便稍后用唯一的 id 替换每个“名称”,这样最终输出将是:
col1   col2
1 5
2 1
3 6
4 1
2 1

即两列中的 Bob -> 1、Tom -> 2 等。

有任何想法吗 :) ?

编辑:感谢大家的精彩回答!据我所知,你们都很棒:)

最佳答案

您希望因子包含两列中的所有唯一名称。

col1 <- factor(c("Bob", "Tom", "Frank", "Jim", "Tom"))
col2 <- factor(c("John", "Bob", "Jane", "Bob", "Bob"))
mynames <- unique(c(levels(col1), levels(col2)))
fcol1 <- factor(col1, levels = mynames)
fcol2 <- factor(col2, levels = mynames)

编辑:如果你用这个替换第三行会好一点:
mynames <- union(levels(col1), levels(col2))

关于r - 连接两列的因子水平,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4855425/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com