gpt4 book ai didi

hive - Parquet 文件在配置单元中显示空值

转载 作者:行者123 更新时间:2023-12-02 03:31:23 24 4
gpt4 key购买 nike

将表从mysql导入到parquet,然后在hive中创建外部表。不知何故,当我查询配置单元上的外部表时,它显示所有值都为空。尽管 parquet-tools cat xyz.parquet 文件正确显示了内容。我哪里做错了?

sqoop import --connect jdbc:mysql://quickstart.cloudera:3306/retail_db \
--username root --password cloudera \
--table order_items --split-by page_id \
--target-dir hdfs:/user/cloudera/proj/order_items \
--compress --compression-codec snappy \
--as-parquetfile \
--num-mappers 1

Create external table hiveorderitems_par
(ord_item_id int,
ord_item_ord_id int,
ord_item_prod_id int,
ord_item_quantity int,
ord_item_subtotal float,
order_item_prod_price float)
row format SERDE 'parquet.hive.serde.ParquetHiveSerDe'
STORED AS INPUTFORMAT "parquet.hive.DeprecatedParquetInputFormat"
OUTPUTFORMAT "parquet.hive.DeprecatedParquetOutputFormat"
location "/user/cloudera/proj/order_items";

hive> select * from hiveorderitems_par;

NULL NULL NULL NULL NULL NULL
NULL NULL NULL NULL NULL NULL
NULL NULL NULL NULL NULL NULL
Time taken: 0.225 seconds, Fetched: 172198 row(s)
hive>

最佳答案

您需要确保创建表期间使用的名称与您要导入的表中的名称匹配。应该可以解决问题。

在 Hive 0.14 之前, Parquet 名称区分大小写。详情可查看here

关于hive - Parquet 文件在配置单元中显示空值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51730401/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com