gpt4 book ai didi

c# - 自动更正文本输入中的拼写错误

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:12:37 26 4
gpt4 key购买 nike

我正在用 C# 编写一个自然语言处理器,用于提取句子的情绪(正面/负面)。但是,在能够辨别拼写错误的单词的情感方面存在一些问题 - 如果它不在字典中,我既不能标记它也不能评价它!

我知道必须有一种方法来处理这个问题。谷歌总是给出准确的建议,我只需要从类似的算法中获取最重要的建议并用它访问数据库。问题是,我不确定从哪里开始算法名称等等。我需要帮助来解决这个问题。

我在网站上查看了类似的问题,发现了一些似乎有用的概念,但处理拼写错误和真实单词之间距离的基本方法基本上依赖于命中数据集中的每个单词,这看起来很可怕效率低下。一些有助于使算法快速运行的想法也将不胜感激;这个分析引擎应该能够每天处理数千个项目。

提前致谢。

最佳答案

这个问题没那么蠢。 Norvig 写了一篇 article关于它。一般来说,难度取决于准确性。 “最简单”的方法是使用前缀树trie 来避免探索所有可能性。基本上你有这样的东西:

enter image description here

并遵循您基本上保持在轨道上的路径。一旦到达卡住点,您应该根据遇到的错误类型检查如何继续前进。

您可以阅读 Norvig 的文章进行更深入的分析。

关于c# - 自动更正文本输入中的拼写错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7310030/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com