gpt4 book ai didi

hadoop - HIVE 中的外部表 - 从原始数据集中转义双引号

转载 作者:可可西里 更新时间:2023-11-01 14:45:42 28 4
gpt4 key购买 nike


我有一个包含字符串和整数值的文件。所有字符串都用“”括起来

int_value1, "string_value2", int_value3, "string_value4"

在 HIVE 中创建 EXTERNAL TABLE 时需要使用什么参数来获取所有不带 "的字符串?

问候
帕维尔

最佳答案

你能试试这个吗?根据您的需要将表更改为外部。

input.txt
100, "string1", 200, "string2"
300, "string3", 400, "string4"

hive> CREATE TABLE test_regex(
> ivalue1 STRING,
> svalue1 STRING,
> ivalue2 STRING,
> svalue2 STRING)
> ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe'
> WITH SERDEPROPERTIES ("input.regex" = "^([0-9]+),\\s+\"(.*)\",\\s+([0-9]+),\\s+\"(.*)\"$","output.format.string" = "%1$s %2$s %3$s %4$s")
> STORED AS TEXTFILE;
OK
Time taken: 1.091 seconds

hive> load data local inpath 'input.txt' overwrite into table test_regex;
OK
Time taken: 0.391 seconds

hive> select *from test_regex;
OK
100 string1 200 string2
300 string3 400 string4
Time taken: 0.212 seconds
hive>

关于hadoop - HIVE 中的外部表 - 从原始数据集中转义双引号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26678166/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com