gpt4 book ai didi

search - 何时使用Hadoop,何时使用ElasticSearch进行分组依据/方面?

转载 作者:行者123 更新时间:2023-12-02 20:13:38 26 4
gpt4 key购买 nike

我已经下载了收件箱,并且正在使用Pig和Hadoop处理电子邮件。我已经使用Pig和Wonderdog在ElasticSearch中为这些电子邮件编制了索引。

现在,我为收件箱中的每个电子邮件地址创建一个网页,以显示这些地址发送的邮件。

我可以通过两种方式做到这一点:

1)按Pig中的电子邮件地址分组,存储到MongoDB(或ElasticSearch)。

2)查询ElasticSearch以使用facets从电子邮件索引中为我返回此列表。

首选答案是什么,它取决于什么?

最佳答案

选项1-按Pig中的电子邮件地址分组,存储到MongoDB(或ElasticSearch):

您正在预先计算结果并将其存储到MongoDB或ElasticSearch。如果数据很大并且不经常更新,这是一件好事。

选项2-查询ElasticSearch以使用构面从电子邮件索引中为我返回此列表。

如果数据经常更新,即使是较小的数据集,也最好使用此选项,因为查询数据(在正确的字段上建立索引)将很快得到结果,而您不必依赖预处理。

关于search - 何时使用Hadoop,何时使用ElasticSearch进行分组依据/方面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10112206/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com