gpt4 book ai didi

r - 在列中,如何重新编码序列中的数据?

转载 作者:行者123 更新时间:2023-12-01 21:59:25 25 4
gpt4 key购买 nike

在我的数据框中,我有一个名为“Colors”的列。颜色列中的数据如下所示:

Red001.jpeg
Red002.jpeg
Red003.jpeg
Red004.jpeg
... you get the pattern...
Red999.jpeg

Blue001.jpeg
...
Blue999.jpeg

Green001.jpeg
...
Green999.jpeg

Yellow001.jpeg
...
Yellow999.jpeg

我想将 Red001.jpegRed999.jpeg 更改为 Red。同样,我也需要对 BlueGreenYellow 执行此操作。我怎样才能使这个过程自动化?

最佳答案

一个简单的正则表达式就可以做到。

sub("(^[[:alpha:]]+)[[:digit:]]*.*", "\\1", color)
# [1] "Red" "Red" "Red" "Red" "Red" "Blue"
# [7] "Blue" "Green" "Green" "Yellow" "Yellow"

数据。

color <- scan(what = character(), text = "
Red001(dot)jpeg
Red002(dot)jpeg
Red003(dot)jpeg
Red004(dot)jpeg
Red999(dot)jpeg
Blue001(dot)jpeg
Blue999(dot)jpeg
Green001(dot)jpeg
Green999(dot)jpeg
Yellow001(dot)jpeg
Yellow999(dot)jpeg
")

关于r - 在列中,如何重新编码序列中的数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54243511/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com