gpt4 book ai didi

search - 有哪些好的云或 3rd 方搜索提供商?

转载 作者:行者123 更新时间:2023-12-01 05:42:38 25 4
gpt4 key购买 nike

我正在开发一个目前流量最少的网站。它使用 Ruby on Rails 构建并在 Heroku 的云平台上运行。

作为网站的一部分,我有大量需要可搜索的页面,每个页面上只有很少的信息。想想一个文章表,其中每篇文章只需要对其标题进行索引,但大约有 800 万篇文章。

Postgres 搜索:
当我第一次开始研究这个时,我运行了 Postgres 全文搜索,但显然它没有优化到足以处理这么多索引项的搜索,并且运行速度很慢。我有一些搜索导致数据库连接超时并需要 30 多秒才能完成。

Websolr:
然后我转向了当时唯一的 Heroku 云搜索插件,OneMoreCloud 的 Websolr。不幸的是,他们按索引的项目数量收费,这对于像我这样没有流量但有大量要索引的项目的网站来说太可怕了,而且我的性能可以说比免费的 Postgres 搜索差。在 Postgres 搜索超时并关闭站点的情况下,Websolr 将返回空的或部分结果集,使查看者认为结果不在数据库中。

索引槽:
现在 Heroku 增加了另一个云搜索提供商 Index Tank,它仍处于测试阶段。虽然它的测试版是免费的,但我不愿意尝试它们,因为对于他们的非 Heroku 服务(不是免费的),他们的最高计划只有 200 万个文档,而每月已经花费了惊人的 500 美元。

谷歌网站搜索:
我目前正在考虑的一个选项是转移到 Google Site Search。 Google 搜索品牌让我相信我不会遇到过去遇到的性能问题。此外,他们的定价非常合理,并且是按流量定价的。但是,不利的一面是,它并不是真正的集成搜索,因为它不连接到数据库中,而只查看网页,因此据我所知,我无法指定仅返回的搜索,例如文章在技​​术文章类别或类似的东西。即使自定义搜索结果的外观似乎也有点痛苦,因为我必须以 XML 格式解析搜索结果,然后使用它来生成我的搜索结果页面,如果我想使用元数据进行自定义在显示中,我必须使用解析的搜索结果来查找数据库中所有结果的行。

对于云或 3rd 方搜索提供商,您有什么好的选择可以推荐给 Stackoverflow 社区吗?

最佳答案

查找 http://www.searchblox.com/ .另一种替代方案,虽然不是云提供商,但将使用 Elasticsearch http://www.elasticsearch.org/ .它的设置和使用非常简单,并且通常可以在 OOTB 中运行。

此外,ES 的创建者本人也将其与其他提供者进行了比较:
ElasticSearch, Sphinx, Lucene, Solr, Xapian. Which fits for which usage?

关于search - 有哪些好的云或 3rd 方搜索提供商?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4444298/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com