gpt4 book ai didi

elasticsearch - 哪个自定义搜索引擎?

转载 作者:行者123 更新时间:2023-12-02 23:00:41 25 4
gpt4 key购买 nike

我有一个在ApachePHP上运行的网站。

我希望对存储在MySQL表和MySQL.pdf文档中的文本实现自定义搜索引擎。

我不确定要使用哪个API。

我看过Google的Custom Search Engine (CSE)Elastic Search。据我了解,Elastic只能在基于Java的服务器上运行,因此我无法走这条路。

我知道Elastic可以通过其REST API满足我的要求。 Google CSE是否能够做到这一点,即搜索存储在数据库表和PDF中的文本?还有其他可能的自定义搜索API吗?

最佳答案

诸如Google自定义搜索引擎(在您的情况下为Google Site Search)之类的解决方案,甚至任何其他网络机器人(例如Nutch),都只会读取Web方面的内容:浏览器可访问的内容(未登录)并进行分类通过显示网页的URL(带有标题和文本内容的摘录)来实现。

如果无需登录即可访问所有PDF,docx和网页,则效果非常好。网络应用创建者应启用该功能。这并不意味着普通用户可以访问所有人,而只能访问机器人(例如,Springer发布者邀请Google机器人访问几乎所有内容,但不能访问普通浏览器)。

如果您希望搜索服务器仅访问数据库的字段,则它需要与数据库对话。 Google Site Search(Google自定义搜索的一种形式)不允许这样做。 ElasticSearch和Apache Solr允许这样做。但是,出于安全原因,大多数Web托管服务都无法使数据库端口从外部访问。因此,您可能会看到另一个要求,您可能需要在本地运行搜索服务器。

运行Java或Google CSE的要求似乎不可避免。我知道没有其他语言具有相同质量的解决方案(例如Drupal可以提供基于MySQL的文本搜索,但容忍度要低得多)。如今,许多云节点都可以运行Java。

关于elasticsearch - 哪个自定义搜索引擎?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34916428/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com