gpt4 book ai didi

c# - 在字典中查找最匹配的单词

转载 作者:行者123 更新时间:2023-11-30 20:02:32 24 4
gpt4 key购买 nike

我正在创建一个程序来读取扫描的手写文档并将其转换为文本。识别出的单词必须来 self 创建的大约 300 个单词的词典。例如,如果手写单词被识别为“heilo”,但我的字典只包含“hello”和“world”,它应该将其转换为“hello”。但是,如果它认出它是“行星”,它应该不会匹配到任何东西。我认为一种可能的方法是创建一个分数,表示识别出的单词与字典中每个单词的匹配程度。如果它没有获得最低分数,则找不到匹配项。

我正在用 C# 编写应用程序。是否有可用的库/示例可以执行此类操作,或者我是否必须从头开始编写所有代码?

谢谢

最佳答案

标准库中没有任何东西可以计算单词之间的距离,但是您可以在 Internet 上找到大量示例:查找 "edit distance""Levenshtein distance" .这个想法是根据第一个字符串的更改次数来衡量相似性,以使其成为第二个字符串。 "heil"和 "hello"之间的距离为 2,因为您需要将 "i"替换为 "l"(第一次编辑),然后附加一个 "o"(第二次编辑)。

在寻找实现或实现您自己的实现时,请避免使用二维数组进行简单的实现,因为它的内存效率不高。使用具有 O(min(m,n)) 内存要求的修改,而不是“天真的”O(m*n)

关于c# - 在字典中查找最匹配的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16749282/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com