gpt4 book ai didi

algorithm - 提高搜索结果的相关性

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:09:35 24 4
gpt4 key购买 nike

我在使搜索输出对最终用户更有用方面遇到了问题。问题与算法和方法有关,而不是与要使用的确切技术或框架有关。

目前我们有一个产品数据库,可以用以下模式描述:

http://goo.gl/391qj

从搜索的角度来看,我们已经完成了非常标准的事情,使用标记分析器的第 3 方文本搜索,处理错误类型和同义词(这不是完整列表,但正如我所说,它超出了范围)。但是我们仍然需要执行额外的工作来使搜索结果更接近现实生活中用户的需求,这可能有点类似于谷歌通过相关性对索引页面进行排名的方式。我们已经认为可能适用于解决问题的想法:

  • 分析广泛搜索引擎中最流行的搜索请求(如何获取它们仍然是一个问题)并提高索引中那些与流行请求相对应(可以找到)的条目的排名;
  • 提高最新(热门)条目的排名;
  • 为最大的一组条目提高排名,这些条目对应于流行的请求并且有一些共同点(这就是为什么它是一个组);

感谢任何帮助或建议方向,在哪里挖掘。

最佳答案

你可以试试pLSA;网上有很多引用资料,应该有库和源码。

编辑:

好吧,我最近仔细研究了 Lucene,它似乎对实际提出的问题给出了更好的答案(它不使用 pLSA)。至于与db的集成,你可以使用Hibernate Search(虽然它似乎没有使用Lucene directy强大)。

关于algorithm - 提高搜索结果的相关性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13858983/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com