gpt4 book ai didi

python - 匹配 DataFrame 中的相似值

转载 作者:行者123 更新时间:2023-12-01 07:14:48 27 4
gpt4 key购买 nike

我有以下形式的 DataFrame:

Name    Count
Car 500
Cars 300
Train 100
trainz 200
Planes 1000
Plane 100
planses 1
Ship 100
ships 10

我尝试将相似的值相互匹配,以便对 count 列中的数字求和以获得相似的值。

因此,输出数据帧将是 name 列中给定类型的第一个找到的值,以及 count 列中所有类似值的总和值。

Name  Count
Car 800
Train 300
Planes 1101
Ship 110

最佳答案

看看difflib .

以下代码

import difflib
print(difflib.get_close_matches('Car', ['Car', 'Cars', 'Train', 'trainz', 'Planes', 'Plane', 'planses', 'Ship', 'ships']))
print(difflib.get_close_matches('Train', ['Car', 'Cars', 'Train', 'trainz', 'Planes', 'Plane', 'planses', 'Ship', 'ships']))
print(difflib.get_close_matches('Planes', ['Car', 'Cars', 'Train', 'trainz', 'Planes', 'Plane', 'planses', 'Ship', 'ships']))
print(difflib.get_close_matches('Ship', ['Car', 'Cars', 'Train', 'trainz', 'Planes', 'Plane', 'planses', 'Ship', 'ships']))

提供您想要的组

['Car', 'Cars']
['Train', 'trainz']
['Planes', 'Plane', 'planses']
['Ship', 'ships']

关于python - 匹配 DataFrame 中的相似值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58029005/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com