gpt4 book ai didi

hadoop - 钻孔不显示配置单元或 hbase 表

转载 作者:可可西里 更新时间:2023-11-01 16:21:58 26 4
gpt4 key购买 nike

我已经创建了一个 hbase 和 hive 表来存储一些数据记录信息。我可以从命令行查询 hbase 和 hive,没有问题。

hbase:扫描MVLogger;//返回 9k 多条记录配置单元:从 MVLogger 中选择 *;//返回 9k 多条记录

我的hbase表定义是

'MVLogger', {NAME => 'dbLogData', DATA_BLOCK_ENCODING => 'NONE', BLOOMFILTER => 'ROW',     REPLICATION_SCOPE => '0', VERSIONS true                                                               
=> '1', COMPRESSION => 'NONE', MIN_VERSIONS => '0', TTL => '2147483647', KEEP_DELETED_CELLS => 'false', BLOCKSIZE => '65
536', IN_MEMORY => 'false', BLOCKCACHE => 'true'}

我的配置单元(外部)表定义是:

CREATE EXTERNAL TABLE `MVLogger`(
`rowid` int,
`ID` int,
`TableName` string,
`CreatedDate` string,
`RowData` string,
`ClientDB` string)
ROW FORMAT SERDE
'org.apache.hadoop.hive.hbase.HBaseSerDe'
STORED BY
'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES (
'serialization.format'='1',
'hbase.columns.mapping'=':key,dbLogData:ID,dbLogData:TableName,dbLogData:CreatedDate,dbLogData:RowData,dbLogData:ClientDB')
TBLPROPERTIES (
'hbase.table.name'='MVLogger')

当我使用 sqlline 并查看钻取模式时,这就是我所看到的

0: jdbc:drill:zk=ip-*.compu> show schemas;

+-------------+
| SCHEMA_NAME |
+-------------+
| hive.default |
| dfs.default |
| dfs.root |
| dfs.tmp |
| cp.default |
| hbase |
| sys |
| INFORMATION_SCHEMA |
+-------------+

当我执行 use [schema](除了 sys 之外的任何一个)然后执行 show tables 时,我什么也得不到...例如

0: jdbc:drill:zk=ip-*.compu> use hbase;
+------------+------------+
| ok | summary |
+------------+------------+
| true | Default schema changed to 'hbase' |
+------------+------------+
1 row selected (0.071 seconds)
0: jdbc:drill:zk=ip-*.compu> show tables;
+--------------+------------+
| TABLE_SCHEMA | TABLE_NAME |
+--------------+------------+
+--------------+------------+
No rows selected (0.37 seconds)

在 Drill Web UI (ambari) 的 Drill 存储选项下,我看到一个启用的 hbase 和 hive。配置单元存储的配置如下。

{
"type": "hive",
"enabled": true,
"configProps": {
"hive.metastore.uris": "thrift://ip-*.compute.internal:9083",
"hive.metastore.warehouse.dir": "/apps/hive/warehouse/",
"fs.default.name": "hdfs://ip-*.compute.internal:8020/",
"hive.metastore.sasl.enabled": "false"
}
}

关于为什么我无法查询 hive/hbase 的任何想法?

更新:该表现在显示在配置单元架构中,但是当我尝试使用简单的 select * from ... 查询它时,它只是挂起,我在任何日志文件中都找不到任何内容。 hive 表的实际数据存储是 hbase BTW。

发现 Hbase .98 与 drill/hbase 插件不兼容... http://mail-archives.apache.org/mod_mbox/incubator-drill-user/201410.mbox/%3CCAKa9qDmN_fZ8V8W1JKW8HVX%3DNJNae7gR-UMcZC9QwKVNynQJkA%40mail.gmail.com%3E

最佳答案

这可能为时已晚,但对于可能看到该帖子并遇到此问题的其他人来说。

0: jdbc:drill:zk=ip-*.compu> use hbase;
+------------+------------+
| ok | summary |
+------------+------------+
| true | Default schema changed to 'hbase' |
+------------+------------+
1 row selected (0.071 seconds)
0: jdbc:drill:zk=ip-*.compu> show tables;
+--------------+------------+
| TABLE_SCHEMA | TABLE_NAME |
+--------------+------------+
+--------------+------------+
No rows selected (0.37 seconds)

正在运行 drill 的用户没有 hbase 的访问权限。授予 drill 用户对 hbase 的访问权限,您将看到这些表。

尝试使用 drill 用户进入 hbase shell 并运行“list”它也将是空的,直到您授予权限然后您将看到表格。

关于hadoop - 钻孔不显示配置单元或 hbase 表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26741172/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com