gpt4 book ai didi

lucene - 如何使用 Lucene 进行个人姓名(名字、姓氏)搜索?

转载 作者:行者123 更新时间:2023-12-05 01:30:00 24 4
gpt4 key购买 nike

我正在为 NFL 球员数据库编写搜索功能。

用户输入搜索字符串,例如“Jason Campbell”“Campbell”“Jason”

我无法获得适当的结果。

索引时我应该使用哪个Analyzer?查询时哪个Query?我应该区分名字和姓氏还是只索引全名字符串?

我想要以下行为:

查询:“Jason Campbell” -> 结果:完全匹配 1 个玩家,Jason Campbell

查询:“Campbell” -> 结果:所有名字中有Campbell的玩家

查询:“Jason” -> 结果:所有名字中带有Jason的玩家

查询:“Cambel” [拼写错误] -> 结果:所有名称中包含 Campbell 的玩家

最佳答案

StandardAnalyzer 应该可以很好地处理上述所有查询。您的第一个查询应该用双引号括起来以实现完全匹配,您的最后一个查询将需要一个模糊查询。例如,您可以设置 Cambell~0.5,您可以将 Campbell 作为匹配项(波浪号后的数值表示模糊度)。

顺便说一句,我建议使用 Solr,它提供拼写检查和自动建议功能,这样您就不必重新发明轮子。这类似于谷歌的“你的意思是......”

关于lucene - 如何使用 Lucene 进行个人姓名(名字、姓氏)搜索?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2790908/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com