gpt4 book ai didi

hadoop - 创建具有固定记录长度的HIVE表

转载 作者:行者123 更新时间:2023-12-02 21:13:56 24 4
gpt4 key购买 nike

如何为特定列创建具有固定记录长度的配置单元表?

我的数据是:

ROW1~|`900~|`3103~|`2015~|`AA~|`1002003829

ROW2~|`900~|`3103~|`2015~|`BB~|`1002005103

ROW3~|`900~|`3103~|`2015~|`CC~|`1002003829

ROW4~|`900~|`3103~|`2015~|`DD~|`1002003829

ROW5~|`900~|`3103~|`2015~|`FF~|`1002003829

最佳答案

这可以通过ROW FORMAT SERDE选项和RegexSerDe实现

例如:

CREATE TABLE event (
code STRING,
location STRING)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.RegexSerDe'
WITH SERDEPROPERTIES (
"input.regex" = "([^]{4}) ([^]*)"
)
STORED AS TEXTFILE;

指定固定长度 code4字段。

引用文献:

Relevant LanguageManual DDL section

GettingStarted example of ROW FORMAT SERDE

Example of using SerDe for fixed length columns

关于hadoop - 创建具有固定记录长度的HIVE表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39405635/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com