gpt4 book ai didi

Python:Fuzzywuzzy 不适用于外来字符

转载 作者:太空宇宙 更新时间:2023-11-03 16:12:55 32 4
gpt4 key购买 nike

当我尝试使用外来字符进行简单的 fuzzywuzzy 表达式时,使用 process.extractOne 方法得到错误的结果(我尝试过使用和不使用 u):

>>> choices= [u"הלכות חנוכה",u"הלכות פורים",u"הלכות סוכה"]
>>> process.extractOne("הלכות סוכה", choices)
(u'\u05d4\u05dc\u05db\u05d5\u05ea \u05d7\u05e0\u05d5\u05db\u05d4', 0)

但 fuzz.ratio 运行平稳:

>>> fuzz.ratio("הלכות ראש השנה", "הלכות תעניות")
69

相同的代码适用于常规字符:

>>> choices= ['this','that','those']
>>> process.extractOne("these", choices)
('those', 80)

可能是什么问题?

最佳答案

按照 scorer= 参数中的方式传递 fuzz.ratio ,并在您要匹配的字符串前面添加 u。

以下作品:

choices= [u"הלכות חנוכה",u"הלכות פורйם",u"הלכות סוכה"]
process.extractOne(u"הלכות סוכה", Choices, Scorer=fuzz.ratio)

(u'\u05d4\u05dc\u05db\u05d5\u05ea\u05e1\u05d5\u05db\u05d4', 100)

其他人也给出相同的分数:

choices= [u"הלכות חנוכה",u"הלכות פורйם",u"הלכות סוכה"]
process.extract(u"הלכות סוכה", Choices, Scorer=fuzz.ratio)

[(u'\u05d4\u05dc\u05db\u05d5\u05ea\u05e1\u05d5\u05db\u05d4', 100), (u'\u05d4\u05dc\u05db\u05d5\u05ea\u05d7\u05e0\u05d5\u05db\u05d4', 86), (u'\u05d4\u05dc\u05db\u05d5\u05ea\u05e4\u05d5\u05e8\u05d9\u05dd', 67)]

Fuzzywuzzy 版本:fuzzywuzzy 0.7.0 和 Python 2.7x

关于Python:Fuzzywuzzy 不适用于外来字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39110793/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com