gpt4 book ai didi

apache - 我可以仅将源文件中的特定数据加载到HIVE表中吗?

转载 作者:行者123 更新时间:2023-12-02 21:35:52 24 4
gpt4 key购买 nike

我有一个带有400个值的管道分隔文本文件。我仅需要从其中位置[1、2、4、5、7、8、9、15、17、18、20 ...]的40个值加载到我的Hive表中,如何实现?

最佳答案

按照这本书:创建一个EXTERNAL表以映射您的Text文件,具有400列;创建一个包含40列的托管表;然后使用SQL来INSERT INTO TABLE target SELECT col1, col2, col4, ..., col72 FROM wide_source
实际上,您不需要映射所有400列-停在要在SQL中使用的最后一列,而忽略其余的列。

关于apache - 我可以仅将源文件中的特定数据加载到HIVE表中吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32358199/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com