gpt4 book ai didi

hadoop - 记录发生

转载 作者:行者123 更新时间:2023-12-02 20:07:36 25 4
gpt4 key购买 nike

我有一个包含以下信息的示例文件
地址

ipaddress-1,10:58

ipaddress-1,11:50

ipaddress-1-10:58

ipaddress-2,11:50

ipaddress-2,10:58

ipaddress-2,10:58

预期输出应为
ipaddress,时间,计数

ipaddress-1,10:58,2

ipadress-1,11:50,1

ipaddress-2,10:58,2

ipaddress-2,11:50,1

需要此输出来了解ip在特定时间范围内击中服务器的次数。

,我尝试使用HIVE,并且能够使用Excel(ODBC)获取报告。但是无法在PIG中找到相同的查询。

最佳答案

这个脚本将发挥神奇作用:

A = load 'test.txt' AS (ip:chararray, time:chararray);
--DESCRIBE A;
--DUMP A;

B = GROUP A BY (ip, time);
--DESCRIBE B;
--DUMP B;

C = FOREACH B GENERATE group, COUNT(A);
DUMP C;

关于hadoop - 记录发生,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21190452/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com