gpt4 book ai didi

hadoop - 外部配置单元表作为 Parquet 文件在查询时返回NULL

转载 作者:行者123 更新时间:2023-12-02 21:26:50 31 4
gpt4 key购买 nike

我通过使用map reduce job创建了一个.parquet文件。现在,我想在此文件的顶部创建一个外部表。这是命令:

CREATE EXTERNAL TABLE testparquet (
NAME STRING,
AGE INT
)
STORED AS PARQUET
LOCATION 'file location'

该表已成功创建,但是当我使用简单的 SELECT *查询该表时,所有字段的数据都为NULL。 hive 的版本是0.13。

有什么我想念的吗?

最佳答案

在使用external文件时,您需要将知道数据模式的元数据存储与实际数据本身进行显式同步。

通常,您将使用INVALIDATE METADATA命令来强制以下查询重新读取数据。如果只有一个表已更新,则也可以使用REFRESH <table-name>

关于hadoop - 外部配置单元表作为 Parquet 文件在查询时返回NULL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35665330/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com