gpt4 book ai didi

algorithm - Google(或任何搜索引擎)的拼写检查器和拼写修复器如何工作?

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:20:06 24 4
gpt4 key购买 nike

在 Google 中搜索内容时,如果您拼错了某个词(可能是误打误撞,也可能是您真正指的是这个非词典词),Google 会说:“正在显示......的结果而不是搜索......”。

我正在尝试弄清楚它是如何工作的。这基本上意味着能够找到与输入的非词典词最接近的词典词。它是如何工作的?我能猜到的一种方法是:数数每个字符的实例,然后扫描字典以找到具有相同编号的单词。每个角色的实例(只有 +-1 的差异)。但这也会返回字谜。

这里是任何用途的某种概率模型,例如马尔可夫等。我对马尔可夫的了解还不够深入,无法随便乱猜,只是一个非常疯狂的猜测。

有什么见解吗?

最佳答案

您忘记了 Google 提供的信息比您多得多。他们跟踪人们何时输入一个词,不选择一个结果,然后在不久之后进行另一次搜索。然后,他们使用此信息为您建议更好的搜索。

参见 How does the Google "Did you mean?" Algorithm work?以获得更全面的解释。

请注意,当您认为 Google 实际上并未进行拼写检查时,这种方法才有意义。相反,他们正在尝试找出什么搜索词可以为您提供所需的答案。显然这和拼写检查之间有很多重叠,但这意味着他们并不总是试图纠正搜索,例如“Flickr”。

关于algorithm - Google(或任何搜索引擎)的拼写检查器和拼写修复器如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5840564/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com