gpt4 book ai didi

hadoop - 学习像在PIG Latin中使用正则表达式一样使用perl。

转载 作者:行者123 更新时间:2023-12-02 21:47:40 25 4
gpt4 key购买 nike

有没有一种方法可以从Pig Latin中的文件中提取某些单词,例如:我希望带有推文的大文件中的所有单词开头都带有#。

Input :  What a lovely day! #Sunshine
Output : Sunshine

最佳答案

看看REGEX_EXTRACT:http://pig.apache.org/docs/r0.12.1/func.html#regex-extract

这应该可以工作(从your_field提取最后一个带有#的单词):

REGEX_EXTRACT(your_field, '.*#(\\w+)($|\\s.*)', 1)

关于hadoop - 学习像在PIG Latin中使用正则表达式一样使用perl。,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23821038/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com