gpt4 book ai didi

Python模糊匹配按类别分组

转载 作者:行者123 更新时间:2023-12-05 03:58:53 27 4
gpt4 key购买 nike

我正在尝试使用模糊匹配来清理数据。df 喜欢:

category description
1 almnd
1 almond
2 choc
2 choco

我希望所有相似的描述都在同一类别下:

category description
1 almnd
1 almnd
2 choc
2 choc

最佳答案

Fuzzy-wuzzy 可能无法胜任这样的任务。您基本上需要根据相似性对单词进行聚类。找到一些建议和代码示例

https://stats.stackexchange.com/questions/123060/clustering-a-long-list-of-strings-words-into-similarity-groups

如果您发现单词和想法的数量过多,可以尝试使用 Gensim most_similar 函数轻松解决

Python: clustering similar words based on word2vec

关于Python模糊匹配按类别分组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57615987/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com