gpt4 book ai didi

hadoop - 如何在 hive 中的多个列上查找变量的频率?

转载 作者:行者123 更新时间:2023-12-02 21:14:25 24 4
gpt4 key购买 nike

我在8栏下有关于性别的数据:

mem1;mem2;mem3;mem4;mem5;mem6;mem7;mem8
MALE;FMALE;UNKN;MALE;FMALE;FMALE;MALE;MALE

现在,我想找出使用​​ hive 的男性,女性,未成年人的频率。
就像是
MALE 4
FMALE 3
UNKN 1

我是Hive的新手,但我知道我们需要使用group by。
有人可以帮我查询吗?

最佳答案

使用Hive Reflect获取计数。

  • 创建将整行作为一列的表
  • 使用Hive Reflection计数列上的出现次数。示例

  • select reflect("org.apache.commons.lang.StringUtils", "countMatches", "MALE;FMALE;UNKN;MALE;FMALE;FMALE;MALE;MALE", "MALE") as Males, reflect("org.apache.commons.lang.StringUtils", "countMatches", "MALE;FMALE;UNKN;MALE;FMALE;FMALE;MALE;MALE", "FEMALE") as females from mytable

    关于hadoop - 如何在 hive 中的多个列上查找变量的频率?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39256318/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com