search - 对多方面搜索软件栈的建议-6ren

search - 对多方面搜索软件栈的建议

转载作者：IT王子更新时间：2023-10-29 06:04:42

25

4

我需要为客户创建一个搜索工具，作为新项目的一部分。记录将是在一个或多个特定日期发生的事情。很高兴获得 SO 的建议，了解哪些工具最适合满足以下要求:

需要(多方面)搜索数万条记录(基于类别、日期、价格等字段)
需要搜索多值字段(即标签)
需要能够根据静态因素(例如价格、距离等)进行排序
需要能够根据动态/频繁变化的因素(例如用户参与度/流量等)进行排序
需要能够只返回在用户自己的社交网络中有事件的记录(即“只显示我的 friend 参与过的结果”)。
将部署在 EC2 中

我目前的想法是:

混合使用 Amazon CloudSearch 和 Redis 等工具
几千条实际上并没有那么多记录。也许大部分工作都在 RDBMS 中完成，并使用 CloudSearch 进行全文搜索？
使用 Redis 为每个用户维护一组最近与之交互的记录，然后将它们合并以获取用户网络中的记录。

我主要担心的是从各种服务 (Redis/CloudSearch) 中提取可能有数千个 ID，然后必须在客户端代码中合并它们的延迟。然而，这也许是没有根据的。

我希望可能有一个我错过的技术堆栈可以为我解决很多问题。我不想重新发明轮子。

欢迎提出任何建议!

最佳答案

我建议您使用 Amazon CloudSearch 来满足您的要求:

Needs to (multi-faceted) search tens of thousands of records (based on fields such as category, date, price etc)

CloudSearch 在多方面搜索方面非常出色。它在亚马逊自己的网站上被广泛使用。而且它的过程非常快。搜索索引保存在内存中，以确保能够以非常高的速率处理请求。

Needs to search on multi-value fields (i.e. tags)

没问题(对于任何搜索引擎)

Needs to be able to order by static factors (such as price, distance etc)

没问题(对于任何搜索引擎)

Needs to be able to order by dynamic / frequently changing factors (such as user engagement / traffic etc)

您可以在 CloudSearch 中设置“公式”。它将使您的请求排名更高或更低。它通常用于:- 通过提高基于发布日期的结果排名来提供“新鲜”内容。- 提升受欢迎的结果

CloudSearch 非常擅长这项任务。所以它看起来很适合你。

Needs to be able to only return records for which there has been activity in the user's own social network (i.e. 'only show me results my friends have engaged with').

我想这没问题。

Will be deployed in EC2

CloudSearch 的胜利。您的请求将保留在亚马逊网络中。让您请求比通过互联网更快。

My main concern is the latency of pulling back perhaps many thousands of IDs from various services (Redis/CloudSearch)

CloudSearch 不会减慢速度。基于负载it might automatically :更新硬件(更大的实例)，启动新实例，跨实例拆分数据。

或许您可以从 Amazon 换成 SimpleDB 而不是 Redis？它将使您轻松扩展。但是在使用 Amazon Cloud Search(或任何搜索引擎数据库)时使用其他数据库的情况并不少见。

Perhaps do the bulk of the work in an RDBMS, with CloudSearch for full-text searching? Maybe. But be carefull RDBMS don't scale up as easily as Cloud Search.

顺便说一句，它是Amazing Cloud Search的创造者但我不为 Amazon Cloud Search 工作 :-)我只是觉得这项技术真的很棒(当它满足您的需要时)。

希望对您有所帮助。希望它不会太乱。

关于search - 对多方面搜索软件栈的建议，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18739604/

25

4

0

文章推荐： java - MapReduce 从 Redis 读取输入

文章推荐： nosql - NoSQL 数据库如何执行聚合函数(AVG、SUM 等)

文章推荐： ruby-on-rails - 如何设置redis连接

.NET 开发人员开始社交网站，建议？
我是一个相对较新的程序员； CS 学士学位，大学毕业大约 2 年，主要使用 C# 中的 .NET。我对 SQL 交互/脚本编写相当流利，并且对 ASP.NET 做了一些工作(主要是维护现有站点)。我
opencv - 动态视频流分析 - 建议？
我计划开发一个简单的解决方案，使我能够即时执行非常基本的视频流分析。我以前从未做过类似的事情，因此这是一个非常笼统和开放的问题。主要重点是检查流是否正常运行，例如 - 卡住帧、黑屏以及音频是否存在。同
关于大型项目的版本控制和避免包含表达式的版本的 Maven 建议
我正在考虑重组一个大型 Maven 项目...... 我们当前结构的基本概述: build [MVN plugins, third party dependency management]:5.1
sql - 查询调优 - 建议
我需要有关附加查询的建议。该查询执行了一个多小时，并根据解释计划进行了全表扫描。我对查询调优还很陌生，希望得到一些建议。首先，为什么我要进行全表扫描，即使我使用的所有列都在其上创建了索引。其次，有
mysql - 一个疯狂的数据库结构 - 建议
我正在做一个项目，我需要在 4 个模型之间创建三个多对多关系。这是它的过程: 常见问题类别可以有许多常见问题子类别，反之亦然。常见问题组可以有许多常见问题的子类别，反之亦然。常见问题可以有许多常见
embedded - 小型嵌入式合成语音库/建议
对于代码大小比语音质量更重要的 PIC 和/或 ARM 嵌入式系统，是否有任何易于使用的免费或廉价的语音合成库？现在似乎 1 meg 的封装被认为是“紧凑的”，但很多微 Controller 都比它小
具有多个有效负载的 Solr 建议
我们正在使用 Solr 建议器功能进行 businessName 查找。当用户输入查询以及匹配的名称时，我们希望 solr 发送来自个人资料的其他属性，如 id、地址、城市、州、国家等字段。我尝试使
Delphi:建议，构建用户界面的想法
我正在构建一个用户界面。我的计划将包括 4 个主要部分: 1) 顶部菜单 - TMainMenu。一个窗口的顶部 2) 主菜单 - TTreeView。一个窗口的左边。 TreeView的每一项=对应
sharepoint - 需要技术推荐/建议
我的公司需要一个任务管理系统来处理从“为X购买一台计算机”到“将一个人转移到另一个国家”这样简单的场景。简单的场景是由一个人处理的单个任务，而更大的任务可以分解为在工作流程中委派给多个人的多个子任务。
marklogic - 内存使用规划 - 建议？
MarkLogic 服务器的林大小与实际内存的建议比率是多少？例如，我目前有一个 190GB 的数据库，并且该数据库随着时间的推移而不断增长。由于数据库会不断增长，我最终需要对该数据库进行集群。因此，
audio - 关于如何解码数据包的线索，建议
去年我收到了一个礼物，它是一个索尼 CMT700Ni 音频站，支持 wifi。它还具有类似于广播的功能，称为“PartyStreaming”。我目前正在挖掘内部，探索它，所以也许我可以结束拥有自己的“
nlp - 如何选择特征选择算法？ - 建议
有没有我可以阅读的研究论文/书籍可以告诉我针对手头的问题哪种特征选择算法最有效。我试图简单地将 Twitter 消息识别为 pos/neg(首先)。我从基于频率的特征选择开始(从 NLTK 书开始)
.net - 需要技术推荐/建议
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，
java - jUnit - 建议
我正在浏览 stackoverflow 以查找有关使用 jUnit 进行测试的常见建议，但仍然有几个问题。我知道，如果要测试的方法很复杂，最好的方法是将其分成小的单独部分并测试每个部分。但问题是 -
Java Collection 建议
我有一个方法如下 public List> categorize(List customClass){ List> returnValue = new ArrayList<>();
svn - 需要关于使用分支和合并回主干的帮助/建议
我的问题是，当按照下面的程序合并时，在最佳实践场景中，“将分支折叠回主干”程序的最后一步是正确的方法吗？我已经使用 svn 很多年了。在我的个人项目中，我总是毫不犹豫地在主干上愉快地进行修改，并且在
iphone - UINavigationController 建议
我读过 UINavigationController当您想从 n 个屏幕跳转到第一个屏幕时，这是最佳选择。这样做需要以下代码: NSMutableArray *array=[[NSMutableArr
java - 文件输入帮助/建议
我有一个文件输入类。它在构造函数中有一个字符串参数来加载提供的文件名。但是，如果文件不存在，它就会退出。如果文件不存在，我希望它输出一条消息 - 但不确定如何...... 这是类(class): pu
flash - 交互式世界地图 - 建议？
我希望创建一个“您访问过的国家/地区” map - 就像您可能在 Facebook、TravelAdvisor 和诸如此类的网站上看到的那样。我尝试过不同的闪光灯套件，但它们并不像我希望的那样先进。
Perl 建议 - 接收文件并更改内容
我需要一些关于如何处理我想用 Perl 编写的脚本的建议。基本上我有一个看起来像这样的文件: id: 1 Relationship: "" name: shelby pet: 1

首页

博学

6Ren·AI

商城

search - 对多方面搜索软件栈的建议