gpt4 book ai didi

python - nltk 中是否有内置方法来查找与给定单词紧密匹配的单词/短语?

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:41:45 25 4
gpt4 key购买 nike

我使用的语音识别软件给出的结果不是最佳的。

例如:session 返回为 fashionmission

现在我有一本像这样的字典:

matches = {
'session': ['fashion', 'mission'],
...
}

我正在遍历所有单词以找到匹配项。

我不介意误报,因为应用程序只接受一组有限的关键字。然而,手动为它们中的每一个输入新词是乏味的。此外,每次我说话时,语音识别器都会生成新词。

我也遇到了将长单词作为一组较小的单词返回的困难,因此上述方法不起作用。

那么,nltk 中是否有内置方法来执行此操作?或者我可以自己编写更好的算法?

最佳答案

您可能需要查看 python-Levenshtein。它是一个用于计算字符串距离/相似性的 python C 扩展模块。

类似这种愚蠢低效的代码可能会起作用:

from Levenshtein import jaro_winkler  # May not be module name

heard_words = "brain"
possible_words = ["watermelon", "brian"]

word_scores = [jaro-winkler(heard_word, possible) for possible in possible_words]
guessed_word = possible_words[word_scores.index(max(word_scores))]

print('I heard {0} and guessed {1}'.format(heard_word, guessed_word))

这是 documentation和一个未维护的 repo .

关于python - nltk 中是否有内置方法来查找与给定单词紧密匹配的单词/短语?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36622652/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com