gpt4 book ai didi

search - 哪些搜索引擎之间的主要区别会影响决定使用哪个搜索专有数据?

转载 作者:行者123 更新时间:2023-12-04 07:11:25 25 4
gpt4 key购买 nike

搜索引擎(DtSearch、Lucene.net、Sphinx、Google 等)之间的主要区别是什么,应该影响使用哪个搜索专有数据的决定?

要搜索的数据由无表示的数据组成,这些数据以名称/值对的形式标记有元数据。我们对各种工具的格式解析能力不感兴趣。此外,搜索结果需要结构良好、无需展示的数据,以便与来自其他(类似结构的存储库)的搜索结果聚合。

下面列出了一些需要告知决策的相关搜索引擎特征。欢迎进一步的建议或经验描述。

• 成本
• 便于使用
• 可配置为仅返回特定标签
• 可以“识别”特定字词为这些结果赋予搜索结果更高的权重
• 快速 < 0.3 秒返回搜索结果或 %E6 记录/文档
• 支持带有类型的标签(查找天气='sunny' 但不查找个性=sunny)
• 支持加权以提供相关性排名
• 按相关性排序返回结果
• 支持同义词
• 支持词干
• 支持停用词
• 支持拼写更正
• 适合并行化或索引构建(如果基于索引)
• 快速重新索引(如果基于索引)
• 快速更新索引(如果基于索引)
• 合并来自多个索引的结果(如果基于索引)
• 邻近度检查:为发现靠近的单词提供更高的相关性

最佳答案

我喜欢带有 DataImportHandler 的 Solr。它支持您的大部分要点,并且设置起来并不难,只要您不介意编辑一些 XML 配置文件即可。它比许多企业级搜索引擎更容易。

GSA(Google Search Appliance)没有任何问题,但对于您想要的控制量,Solr 是更好的选择。

Lucene/Solr

关于search - 哪些搜索引擎之间的主要区别会影响决定使用哪个搜索专有数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/278535/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com