gpt4 book ai didi

php - 从头开始为私有(private)文章构建一个快速语义 MySQL 搜索引擎

转载 作者:行者123 更新时间:2023-11-29 02:32:29 25 4
gpt4 key购买 nike

我正在从事一个项目,该项目将涉及网站内文章的全文 语义搜索(如果无法结合它,用户可以选择任何一个选项)。这些文章是订阅制的,登录后才能搜索;因此外部搜索引擎或其 API 无法访问它们。

I read about Sphinx用于全文关键字搜索(我打算在这方面实现它),但我不确定如何从中构建语义搜索引擎。例如搜索“美国总统”应列出包含对美国总统真实姓名的引用的文章,例如乔治·华盛顿、比尔·克林顿(或威廉·杰斐逊·克林顿)。

我有一些想法,也许可以使用一种标记系统来关联各种关键字,例如将总统与乔治·华盛顿以及总统与比尔·克林顿相关联,但由于数据确实非常庞大并且将存在许多此类关系,我不知道如何进一步推进这个想法。

请建议我如何从头开始构建语义搜索引擎(我想 Sphinx 可以处理全文关键字搜索)。否则,请告知我任何基于 Internet 的资源,或者是否已经存在任何语言的软件可以集成到我的应用程序中。

附言我选择的数据库是 MySQL(如果其他数据库系统更适合这项任务,请告知),我更喜欢用 PHP 编程,但如果我需要学习 Python 或任何其他对这项任务更有效的语言,我会愿意。

我已经在 answers.semanticweb.com 搜索过

最佳答案

我会使用 Apache Solr .我认为它比 Sphinx 更灵活。 Solr 支持全文搜索,我相信有语义支持的附加组件(如 siren )。 Solr 是 Lucene 的服务器化版本。

Solr 支持 SynonymFilter:http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#SynonymFilter

这篇文章讨论了一些优化内容检索的策略 http://www.lucidimagination.com/devzone/technical-articles/optimizing-findability-lucene-and-solr

关于php - 从头开始为私有(private)文章构建一个快速语义 MySQL 搜索引擎,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10987883/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com