gpt4 book ai didi

amazon-web-services - Cloudsearch 模糊术语和短语

转载 作者:行者123 更新时间:2023-12-04 01:00:11 27 4
gpt4 key购买 nike

我正在尝试了解模糊搜索在 AWS CloudSearch 上的工作原理

我想找到“星球大战”,但在我的搜索中,我拼写了它

ster wers

我的应用程序的逻辑会增加模糊但它永远不会返回星球大战。
我试过:
ster~1 wers~1
"ster wers"~2
"ster"~1 "wers"~1

我在这里缺少什么?

最佳答案

您的查询不起作用的原因是 CloudSearch 是如何产生的。如果您的字段使用设置为 English 的分析方案进行索引,然后 wars将以其词干形式存储为 war .
这是一个关于词干提取如何影响您的查询的小演示。
使用非词干查询 ('ster wers') 进行搜索:
使用非词干查询进行搜索需要匹配 werswar , 相差 2 个字符并需要此查询: q=ster~1+wers~2 .
使用词干查询 ('ster wer') 进行搜索:
使用词干版本搜索意味着您正在匹配 werwar你只差 1 个字符。因此ster~1 wer~1将获得所需的结果(即它匹配 star wars )。
如何修复:
如果您将相关字段的分析方案配置为不使用任何词干提取,则您描述的用例将起作用。

  • 为此,请登录 AWS Web 控制台并转到分析方案 --> 添加分析方案:
    enter image description here
  • 然后转到索引选项并配置您的字段以使用新的无词干分析方案:
    enter image description here
  • 提交您的更改并重新编制索引。

  • 这将解决您的问题,但当然您将失去词干的好处。你不能吃你的蛋糕也吃它。

    关于amazon-web-services - Cloudsearch 模糊术语和短语,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29368070/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com