gpt4 book ai didi

hadoop - Presto 不从 Hive Metabase 返回行

转载 作者:可可西里 更新时间:2023-11-01 15:52:42 26 4
gpt4 key购买 nike

我是 AWS EMR 的新手。我已经启动并运行了 Hive,并且可以毫无问题地查询 S3 中的外部表。我现在已经将 Presto 安装到 EMR 集群上,这似乎已启动并正在运行并且可以读取 Hive 元数据库。但是,我运行的每个查询都会返回列标题,但实际上不会返回任何列(下面的查询)。

presto:default> select count(*) from patrequests;
_col0
-------
0
(1 row)

Query 20171113_163811_00033_vdw6c, FINISHED, 1 node
Splits: 17 total, 17 done (100.00%)
0:00 [0 rows, 0B] [0 rows/s, 0B/s]

Hive 中的相同查询运行良好:

hive> select * from patrequests limit 10;
OK
2017-10-01T00:00:18.6772628Z 779 ***** ***** ***** ***** 2017 10
Time taken: 2.876 seconds, Fetched: 10 row(s)

数据以 JSON 格式存储在 S3 存储桶中 - 无嵌套。

非常感谢任何帮助。

谢谢

最佳答案

问题似乎出在 Presto 无法使用 JSON Serde org.openx.data.jsonserde.JsonSerDe。使用 S3 存储桶中的以下内容引导实例似乎可以解决问题:

#!/bin/bash
wget -P /usr/lib/presto/plugin/hive-hadoop2/ 'https://s3-eu-west-1.amazonaws.com/########/json-serde-1.3.9-SNAPSHOT-jar-with-dependencies.jar';
wget -P /usr/lib/hive-hcatalog/share/hcatalog/ 'https://s3-eu-west-1.amazonaws.com/########/json-serde-1.3.9-SNAPSHOT-jar-with-dependencies.jar';

关于hadoop - Presto 不从 Hive Metabase 返回行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47269548/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com