gpt4 book ai didi

hadoop - 用于实时统计的 elasticsearch vs hbase/hadoop

转载 作者:可可西里 更新时间:2023-11-01 14:12:45 25 4
gpt4 key购买 nike

我每周登录数百万个小日志文件来做:

  • 数据挖掘的临时查询
  • 加入、比较、过滤和计算值
  • 使用 python 进行许多全文搜索
  • 对所有数百万文档运行此操作,每天几次

我的第一个想法是将所有文档放在 HBase/HDFS 中并运行 Hadoop 作业生成统计结果。

问题是:一些结果必须接近实时。

因此,经过一些研究,我发现了 ElasticSearch,现在我正在考虑传输所有数百万个文档并使用 DSL 查询来生成统计结果。

这是个好主意吗? ElasticSearch 似乎很容易处理数百万/数十亿的文档。

最佳答案

关于hadoop - 用于实时统计的 elasticsearch vs hbase/hadoop,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22043348/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com