gpt4 book ai didi

algorithm - 不使用字典识别拼写错误的算法类是什么?

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:51:36 25 4
gpt4 key购买 nike

请考虑以下情况:在一段文本中,字符串“slnFile”出现了五次,“snlFile”出现了一次。后者是拼写错误,但请注意,前一个单词不在正确的字典中(“slnFile”是一个变量名称,表示“visual studio 解决方案文件”,仅对文本段的作者有意义)。

我自己可以想到一个简单的拼写检查实现:在文本段中找到拼写相差一个字符的所有单词对,将频率计数为 1 的任何单词标记为可疑单词。 (我知道这不是一个完美的解决方案。)

我的问题:处理这个问题的算法类的名称是什么?

最佳答案

计算Damerau-Levenshtein distance在词汇表中的所有单词之间。标记那些出现频率非常低且与频繁出现的词的距离特别小的词。

关于algorithm - 不使用字典识别拼写错误的算法类是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18729059/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com