gpt4 book ai didi

hadoop - 如何提高Hive的速度

转载 作者:行者123 更新时间:2023-12-02 21:36:04 25 4
gpt4 key购买 nike

我从Twitter收集数据并将其存储在hdfs中。我想将这些推文根据时间戳进行排序,但是此查询需要大量时间。

1.5 gb的数据需要1分钟的时间进行排序,我认为这远远超出了预期。

如何加快查询速度?

感谢帮助。

最佳答案

您不能期望Hive更快地提供任何服务。在我们的Prod集群上,涉及批处理作业的MapReduce DAG的查询的典型开销为20秒-这是通过精简JDBC连接实现的;使用Hive CLI时,还有20多个时间用于启动JVM和预热TEZ容器。

如果您需要关系型DBMS的响应时间,只需使用MySQL。或者也许是分布式的东西,例如MemSQL的免费版本。

关于hadoop - 如何提高Hive的速度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32139955/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com