gpt4 book ai didi

regex - Hive 正则表达式将字符串拆分为两个不同的字段

转载 作者:可可西里 更新时间:2023-11-01 14:53:07 25 4
gpt4 key购买 nike

我的记录是这样的:

0x0000110PPPP111KZY0 H123456789 XYZ 000000000000000000607532030000607532000060753203002014101707199999

我正在寻找一个正则表达式,我可以在其中将前 3 个字符 0x0 拆分为配置单元表中的一个字段,其余 000110PPPP111KZY0 拆分为第二个字段,依此类推定长文件,无分隔符。

最佳答案

我没有使用 hadoop 或 hive 的经验,但是以下正则表达式将与我相信您正在寻找的内容一起使用。

/(\dx\d)(.*)/ 这会将 0x0 捕获/拆分到第一个捕获组中,然后将所有内容拆分到第二个捕获组中。如果您只想要 0x0 数字之后的数字/字母(因此没有 H123456789 或尾随的单词和字母),请使用 /(\dx\d)([^ ]*)/

如果我误解了您要查找的内容,您能否澄清一下您提供的代码中您想选择和/或捕获的确切部分?谢谢!

关于regex - Hive 正则表达式将字符串拆分为两个不同的字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31689914/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com