gpt4 book ai didi

azure - 如何使用 PARQUET FORMAT 创建外部配置单元表

转载 作者:行者123 更新时间:2023-12-03 02:07:47 25 4
gpt4 key购买 nike

我遇到了在 Parquet 文件上创建配置单元表的问题。有人可以帮忙解决这个问题吗?我读过很多文章,但无法加载 parquet 文件。

我关注了这个article

最佳答案

根据 MS Document ,我在我的环境中重现了相同的结果并得到了以下结果:

如果您要创建 parquet 格式,请确保添加 ROW FORMAT SERDE'org.apache.hadoop.hive.ql.io.parquet.serde .ParquetHiveSerDe'

请按照此代码创建 Parquet 格式的外部 Hive 表。

CREATE EXTERNAL TABLE `demo_table`(
`first_name` string,
`Last_name` int)
ROW FORMAT SERDE
'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'

STORED AS INPUTFORMAT
'org.apache.hadoop.hive.ql.io.SymlinkTextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
'dbfs:/FileStore/'
TBLPROPERTIES (
'totalSize'='2335',
'numRows'='240',
'rawDataSize'='2095',
'COLUMN_STATS_ACCURATE'='true',
'numFiles'='1',
'transient_lastDdlTime'='1418173653')

enter image description here

输出:

enter image description here

关于azure - 如何使用 PARQUET FORMAT 创建外部配置单元表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74393047/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com