gpt4 book ai didi

regex - REGEX_EXTRACT_ALL不起作用,为什么?

转载 作者:行者123 更新时间:2023-12-02 21:52:58 25 4
gpt4 key购买 nike

a = load '/text.log' using TextLoader() as line:chararray;
b = foreach a generate REGEX_EXTRACT_ALL(line,'projectVersion:[^\t]*');
c = group b by $0;
d = foreach c generate group, COUNT(b);
dump d;

以上是我的脚本,我的示例数据有点像..
projectName:test    logType:test    logSource:test  logBody:test

我得到了这个结果
(,0)

我查看了Pig API,它说如果模式不匹配,REGEX_EXTRACT_ALL将返回空元组,但是显然存在该模式。所以我尝试了更简单的任务。
b = foreach a generate REGEX_EXTRACT_ALL(line,'projectVersion');

并尝试了
b = foreach a generate REGEX_EXTRACT_ALL(line,'p');

我一次又一次地得到空结果。

我不知道为什么这个简单的事情不起作用,我做错了什么吗?

最佳答案

尝试

b = foreach a generate REGEX_EXTRACT_ALL(line,'projectVersion:([^\t]*)');

您需要使用“()”来表示所需的内容。

对你来说
projectName:test    logType:test    logSource:test  logBody:test

b将有一个元组 ('test')

关于regex - REGEX_EXTRACT_ALL不起作用,为什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18399114/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com