gpt4 book ai didi

hadoop - Hive外部表定界符在创建后损坏

转载 作者:行者123 更新时间:2023-12-02 21:06:08 25 4
gpt4 key购买 nike

我有一个带有损坏的管道定界符的源文件。我的配置单元外部表也已用断开的管道定界符创建。但是在创建表之后,我看到了像'j'这样的分隔符。我也无法从表中查询。

创建的语法:

尝试使用ASCII值

PARTITIONED BY ( 
eventdate date)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\u00A6'
STORED AS PARQUET

还有管子
PARTITIONED BY ( 
eventdate date)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '¦'
STORED AS PARQUET

创建表后:
PARTITIONED BY (                                                           
eventdate date)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY 'j'
STORED AS INPUTFORMAT

请帮助建议以上部分。非常感谢。

最佳答案

您正在使用

PARTITIONED BY ( 
eventdate date)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '|'
STORED AS PARQUET

代替
PARTITIONED BY ( 
eventdate date)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '|'
STORED AS TEXTFILE

可能是因为您告诉 hive 您的数据存储为 Parquet 。让我知道是否可以解决问题

关于hadoop - Hive外部表定界符在创建后损坏,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41849570/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com