gpt4 book ai didi

r - 在 R 中的大型数据帧上匹配多个条件

转载 作者:行者123 更新时间:2023-12-02 05:23:16 24 4
gpt4 key购买 nike

我在下面提到了两个数据框:

DF_1

Val1           Val2
COPPAR Ert Metal
Bittar Gourd vegetble
Blackbery d Fruite

DF_2

Val4           Val5        Type
Copper Metal A-I
Bitter Gourd Vegetable B-II
Blackberry Fruit C-III

我在DF_1中有一些错误在Val1Val2 (其中 Val1Val2 中的相同字符串的拼写不同)并在 DF_2 中有正确的列表。只是想匹配Val1 DF_1 的 Val4 DF_2 并基于正确的值( New_Val1 )我想要 Val5New_Val2Type ,在输出数据框中。

输出数据框:

Val1           Val2      New_Val1       New_Val2    Type
COPPAR Metal Copper Ert Metal A-I
Bittar Gourd vegetble Bitter Gourd Vegetable B-II
Blackbery Fruite Blackberry Fruit C-III

最佳答案

这是基于 soundex

library(phonics)

df1['match1']=soundex(df1$Val1)
df1['match2']=soundex(df1$Val2)
df2['match1']=soundex(df2$Val4)
df2['match2']=soundex(df2$Val5)
merge(df1,df2,by=c('match1','match2'))
match1 match2 Val1 Val2 Val4 Val5 Type
1 B360 V231 Bittar Gourd vegetble Bitter Gourd Vegetable B-II
2 B421 F630 Blackbery d Fruite Blackberry Fruit C-III
3 C160 M340 COPPAR Ert Metal Copper Metal A-I

关于r - 在 R 中的大型数据帧上匹配多个条件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49635639/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com