gpt4 book ai didi

hadoop - 空值从 csv 文件上传到配置单元表

转载 作者:可可西里 更新时间:2023-11-01 14:18:49 26 4
gpt4 key购买 nike

我是 hadoop hive 的新手。我们正在使用开源 hadoop hive。它安装在ubuntu 单节点集群上。我在一个 csv 文件中有 100 万行数据,我将它从 Windows 移到了 Linux。使用 foolwing 命令将数据上传到配置单元时,空值将上传到表中。

LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv' 
OVERWRITE INTO TABLE rejstats;

我什至尝试通过 tplacing 文件 hdfs 来上传值,但仍然是同样的问题。

我的表结构如下:

CREATE TABLE rejstats( amount_requested INT , appdate TIMESTAMP , loan_title STRING , dbt_income_ratio FLOAT , city STRING , state STRING , employment_lenght STRING)
ROW FORMAT
DELIMITED FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE;

我附上返回的空值的屏幕截图。

请任何人帮助我解决这个问题。谢谢。

问候,迪维亚。

最佳答案

我认为您正在尝试在您使用 FIELDS TERMINATED BY '\t' 的表中输入一个逗号分隔的文件,即制表符。尝试以下操作:

CREATE TABLE rejstats (amount_requested INT , appdate TIMESTAMP , 
loan_title STRING , dbt_income_ratio FLOAT , city STRING ,
state STRING , employment_lenght STRING) ROW FORMAT DELIMITED FIELDS
TERMINATED BY ',' STORED AS TEXTFILE;

LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv'
OVERWRITE INTO TABLE rejstats;

关于hadoop - 空值从 csv 文件上传到配置单元表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17543911/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com