gpt4 book ai didi

r - 将 csv 数据加载到 Hive 表中时出错

转载 作者:行者123 更新时间:2023-12-04 06:18:30 28 4
gpt4 key购买 nike

我在 hadoop 中有一个 csv 文件,我有一个 Hive 表,现在我想将该 csv 文件加载到这个 Hive 表中

我已经使用 load LOAD DATA local 'path/to/csv/file' overwrite INTO TABLE tablename;

最终出现此错误:

Error in .verify.JDBC.result(r, "Unable to retrieve JDBC result set for ",  : 
Unable to retrieve JDBC result set for LOAD DATA local
'path/to/csv/file' overwrite INTO TABLE tablename
(Error while processing statement: FAILED:
ParseException line 1:16 missing INPATH at ''path/tp csv/file'' near '<EOF>'
)

注意:我正在尝试使用 r 中的 RJDBC 连接

最佳答案

我开发了一个工具来从 csv 文件生成 hive 脚本。以下是有关如何生成文件的几个示例。
工具--https://sourceforge.net/projects/csvtohive/?source=directory

  • 使用 Browse 选择一个 CSV 文件并设置 hadoop 根目录,例如:/user/bigdataproject/
  • 工具使用所有 csv 文件生成 Hadoop 脚本,以下是一个示例
    生成的 Hadoop 脚本将 csv 插入到 Hadoop 中
    #!/bin/bash -v

    hadoop fs -put ./AllstarFull.csv /user/bigdataproject/AllstarFull.csv
    hive -f ./AllstarFull.hive



    hadoop fs -put ./Appearances.csv /user/bigdataproject/Appearances.csv
    hive -f ./Appearances.hive



    hadoop fs -put ./AwardsManagers.csv /user/bigdataproject/AwardsManagers.csv
    hive -f ./AwardsManagers.hive

  • 生成的 Hive 脚本示例
    CREATE DATABASE IF NOT EXISTS lahman;

    USE lahman;

    CREATE TABLE AllstarFull (playerID string,yearID string,gameNum string,gameID string,teamID string,lgID string,GP string,startingPos string) row format delimited fields terminated by ',' stored as textfile;

    LOAD DATA INPATH '/user/bigdataproject/AllstarFull.csv' OVERWRITE INTO TABLE AllstarFull;

    SELECT * FROM AllstarFull;

  • 谢谢
    维杰

    关于r - 将 csv 数据加载到 Hive 表中时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26528756/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com