gpt4 book ai didi

apache-spark - 根据CSV分号分隔数据在HIVE中创建表

转载 作者:行者123 更新时间:2023-12-02 20:14:54 24 4
gpt4 key购买 nike

我刚接触过HIVE,这是我的第一次尝试
这是我的数据样本

age;"job";"marital";"education";"default";"balance";"housing";"loan";"contact";"day";"month";"duration";"campaign";"pdays";"previous";"poutcome";"y"58;"management";"married";"tertiary";"no";2143;"yes";"no";"unknown";5;"may";261;1;-1;0;"unknown";"no"44;"technician";"single";"secondary";"no";29;"yes";"no";"unknown";5;"may";151;1;-1;0;"unknown";"no"


我尝试使用以下命令创建表:
create external table bank_dataset(age TINYINT, job string, education string, default BOOLEAN, balance INT, housing BOOLEAN, loan BOOLEAN, contact STRING,day STRING, month STRING, duration INT,campaign INT, pdays INT, previous INT, poutcome STRING,y BOOLEAN)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\;'
location '/user/user_name/Bank_Project';
我创建了表,然后我对其执行的任何查询(除了从表中选择*之外)都会产生错误。
我认为这与“;”有关数据之间。
有什么建议么?

最佳答案

是的,某些配置单元版本(如Asure)中的问题终止于此。请使用FIELDS TERMINATED BY '\u0059'代替“;”。

create external table bank_dataset(age TINYINT, job string, education string, default BOOLEAN, balance INT, housing BOOLEAN, loan BOOLEAN, contact STRING,day STRING, month STRING, duration INT,campaign INT, pdays INT, previous INT, poutcome STRING,y BOOLEAN)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\u0059'
location '/user/user_name/Bank_Project';
STORED AS TEXTFILE;
请注意,在更高配置单元版本中, '\u003B'可能有效。分号(;)的Unicode代码点是 U+003B,因此第二个解决方案更有意义。但是我认为配置单元将0059假定为十进制,并解释为“;”。

关于apache-spark - 根据CSV分号分隔数据在HIVE中创建表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64529016/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com