gpt4 book ai didi

hadoop - 使用Pig Latin从文件中获取最大日期

转载 作者:行者123 更新时间:2023-12-02 18:57:21 26 4
gpt4 key购买 nike

我有一个带有日期和其他一些列的文本文件。
日期列值的格式为“yyyy-MM-dd HH:mm:ss”。

我想从文本文件中获取最大日期或最新日期。
(注意:我看到MAX函数仅在Pig Latin中的GROUP BY时有效)

谁能建议使用Pig Latin或其他替代方法来获得这种效果吗?

最佳答案

根据样本数据集,

Apple|$600|2009-01-14 00:00:00| 
Apple|$650|2010-12-16 10:20:20|
Banana|$800|2019-12-14 00:00:00|
Banana|$800|2016-11-11 01:45:03|

可以使用以下方法检索日期列中的最大值
fruits = LOAD 'fruits.txt' using PigStorage('|');
dt = FOREACH fruits GENERATE ToDate($2, 'yyyy-MM-dd HH:mm:ss');
odt = ORDER dt by $0 DESC;
max = LIMIT odt 1;
dump max;

关于hadoop - 使用Pig Latin从文件中获取最大日期,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60744960/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com