gpt4 book ai didi

regex - 文件名的一部分作为 Hive 表中的列

转载 作者:可可西里 更新时间:2023-11-01 15:29:29 25 4
gpt4 key购买 nike

我想将文件名的第一部分作为 Hive 表中的一列

My filename is : 20151102114450.46400_Always_1446482638967.xml

我在 Microsoft Azure 的 Hive 中使用正则表达式编写了一个查询(下面的查询)来获取它的第一部分,即 20151102114450

但是当我运行查询时,我得到的输出为 20151102164358

select CAST(regexp_replace(regexp_replace(regexp_replace(CAST(CAST(regexp_replace(split(INPUT__FILE__NAME,'[_]')[2],'.xml','') AS BIGINT) as TimeStamp),':',''),'-',''),' ','') AS BIGINT) as VERSION

谁能告诉我哪里出了问题以及需要纠正什么?

最佳答案

我在 Cloudera 中尝试过这个,希望它也能在 Azure 中工作。

select from_unixtime(unix_timestamp(regexp_extract('20151102114450.46400_Always_1446482638967.xml','^(.*?)\\.'),'yyyyMMddHHmmss'),'yyyy-MMM-dd HH:mm:ss');

2015-Nov-02 11:44:50
Time taken: 19.644 seconds, Fetched: 1 row(s)

另一种选择:

select from_unixtime(unix_timestamp(split('20151102114450.46400_Always_1446482638967.xml','\\.')[0],'yyyyMMddHHmmss'),'yyyy-MMM-dd HH:mm:ss')

关于regex - 文件名的一部分作为 Hive 表中的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37331487/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com