gpt4 book ai didi

python - Apache Pig 和用户定义的函数

转载 作者:可可西里 更新时间:2023-11-01 16:53:01 26 4
gpt4 key购买 nike

我正在尝试使用 Apache Pig 读取日志文件。阅读文件后,我想在 Python 中使用我自己的用户定义函数。我想要做的是类似于以下代码的事情,但它会导致错误 1066:无法打开别名 B 的迭代器,我无法通过谷歌找到解决方案。

register 'userdef.py' using jython as parser;
A = LOAD 'test_data' using PigStorage() as (row);
B = FOREACH A GENERATE parser.split(A.row);
DUMP B;

但是,如果我将 A.row 替换为空字符串 '',则函数调用完成并且不会发生错误(但数据既不会传递也不会处理)。

以字符串格式将数据行传递给 UDF 的正确方法是什么?

最佳答案

您不需要指定 A.row,单独使用 row 或 $0 都可以。$0 是第一列,$1 第二列。

请注意,如果 PigStorage 发现任何分隔符,它会自动拆分您的数据,因此行可能只是每行的第一个元素。

安东尼。

关于python - Apache Pig 和用户定义的函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31139610/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com