gpt4 book ai didi

sql - 在 hive 表中插入的值,双引号用于来自 csv 文件的字符串

转载 作者:可可西里 更新时间:2023-11-01 14:25:37 31 4
gpt4 key购买 nike

我正在将一个 csv 文件导出到配置单元表中。关于 csv 文件:列值用双引号括起来,用逗号分隔。

来自 csv 的示例记录

"4","good"
"3","not bad"
"1","very worst"

我用下面的语句创建了一个 hive 表,

创建外部表 currys(review_rating string,review_comment string ) 由 ',' 分隔的行格式字段;

表已创建。

现在我使用命令 load data local inpath 加载了数据并且成功了。当我查询表格时,

select * from currys;

结果是:

"4"  "good"
"3" "not bad"
"1" "very worst"

代替

4  good
3 not bad
1 very worst

记录插入了不应该的双引号。

请让我知道如何去掉这个双引号。非常感谢任何帮助或指导......

谢谢!

最佳答案

你在使用任何serde吗?如果是这样,那么您可以在 SERDE PROPERTIES 中编写一个 regex 命令来删除引号。

或者您可以使用来自herecsv-serde并定义 引号字符

关于sql - 在 hive 表中插入的值,双引号用于来自 csv 文件的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23821062/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com