作者热门文章
- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
示例数据:(tsv 文件:sampl)
1 a
2 b
3 c
raw= load 'sampl' using PigStorage() as (f1:chararray,f2:chararray);
grouped = group raw by f1;
describe grouped;
fields = foreach grouped {
x = sample raw 1;
generate x;
}
当我运行它时,我在 x = sample raw 1;
行收到错误错误 1200:不匹配的输入“原始”需要 LEFT_PAREN
是否不允许对分组记录进行抽样?
最佳答案
您不能在嵌套 block 中使用“sample”命令。这在 pig 中不受支持。
嵌套 block 中只允许少数操作(CROSS、DISTINCT、FILTER、FOREACH、LIMIT 和 ORDER BY)。您必须在嵌套 block 之外使用示例命令。
另一个问题是,您正在使用默认分隔符(即制表符)加载输入数据。但是你的输入数据是用空格分隔的,所以你需要像这样改变你的脚本
raw= load 'sampl' using PigStorage(' ') as (f1:chararray,f2:chararray);
关于hadoop - 通过抛出错误对组内的记录进行抽样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26935622/
我想从列表中抽取项目样本,但我想设置每个项目被包含的概率,而不是要抽取的项目总数(所以 random.sample( ) 不起作用)。我用下面的代码得到了我想要的效果(其中 p 是包含的概率,item
我正在使用 Google Analytics Reporting API,但即使指定日期范围内的 session 远少于 500K limit,我也会得到抽样结果。 .我一个月只有约 4K 次 ses
我是一名优秀的程序员,十分优秀!