gpt4 book ai didi

python - 从数据框中删除相似的字符串重复项

转载 作者:太空宇宙 更新时间:2023-11-04 11:10:19 24 4
gpt4 key购买 nike

我有 df,目前看起来像这样:

Car Name      Number
Adam Leaf 9
Adamm Leaf 9
Adam Lea NaN
Adam-Leaf NaN
Adam/Leaf 9
Claire-Green NaN
Cliare Green 3
Claire Green 3
Claire Gren NaN
Claire/Green 3

我正在尝试删除变体以实现类似的效果

Car Name      Number
Adam Leaf 9
Claire Green 3

最佳答案

这是jellyfish的一种方式

import jellyfish

s=df.groupby(df['Car Name'].apply(jellyfish.soundex)).first()
Car Name Number
Car Name
A354 Adam Leaf 9.0
C462 Claire-Green 3.0

关于python - 从数据框中删除相似的字符串重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58434710/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com