gpt4 book ai didi

hadoop - 在 Pig 中使用带 MATCHES 的双引号

转载 作者:可可西里 更新时间:2023-11-01 15:28:01 25 4
gpt4 key购买 nike

我正在尝试根据其中包含双引号的字符串模式过滤我在 pig 中的输入。

例如,假设 input.txt 有

field1="value1" field2="value2"field1="value1" field2="val2"

I want to filter out lines which has field2="value2". So, I run the following script

A = LOAD 'input.txt' AS line:chararray;
B = FILTER A BY line MATCHES '.*field2="value2".*';
DUMP B;

上面的代码片段抛出 0 条记录。如果我不给出结尾的双引号,它就可以工作

B = FILTER A BY line MATCHES '.*field2="value2.*';

我很想知道为什么前者不起作用。

最佳答案

尝试使用引号的转义字符:

A = LOAD 'input.txt' AS line:chararray;
B = FILTER A BY line MATCHES '.*field2=\\"value2\\".*';
DUMP B;

关于hadoop - 在 Pig 中使用带 MATCHES 的双引号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40093424/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com