PIG-如何按字段分组,其中有多个条目

德波

我希望能够按小时数分组,我知道我将提交多个小时数条目。例如,如下所示的第11小时将出现多次。我该怎么做呢?

hour,windSpeed
11, 3.6
2 , 6.8
11, 2.5
13, 5.0
14, 8.9
11, 3.2

所以我有这个,我只想按小时分组

因此,例如,我们想要 {11: 3.6, 2.5, 3.2 }

并重新分配,因为只有一个值会归类为自己的值

{14: 8.9}

{2: 6.8}

answer = FOREACH weather_data GENERATE $0 AS hour, $1 as speed
VK_217

按小时分组

A = FOREACH weather_data GENERATE $0 AS hour, $1 as speed;
B = GROUP A by hour;
DUMP B;

如果要汇总,请使用总和

C = FOREACH B generate group as hour,SUM(A.speed) as Total;
DUMP C;

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章