gpt4 book ai didi

hadoop - 在 s3n 上查询 Orc 文件非常慢

转载 作者:可可西里 更新时间:2023-11-01 16:10:49 26 4
gpt4 key购买 nike

只要我在 hdfs 上查询我的 ORC 文件,一切都很好而且非常快 - 但是当我想查询存储在 S3 上的数据时,它非常慢并且查询无法完成。

我正在使用 Hive 0.12我的创建语句看起来像这样

CREATE external TABLE externalORCFiles (... , ... , ...)
STORED AS ORC
location 's3n://...';

在我看来,ORC + Presto + S3 ( see here ) 也存在同样的问题,但我找不到与 Hive 类似的东西

最佳答案

对于冷库来说,S3是一个非常好的存储空间。然而,它并不真正适合 HDFS 空间。 S3 数据以大约 50Mbps 的速度移动(可能或多或少,但比 HDFS 慢得多)。您可以在速度和成本之间做出选择。

关于hadoop - 在 s3n 上查询 Orc 文件非常慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31951873/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com