gpt4 book ai didi

hadoop - hive -标签计数

转载 作者:行者123 更新时间:2023-12-02 21:37:46 24 4
gpt4 key购买 nike

我被HiveQL计数标签而陷入困境。
我的问题:
我将这些标签的格式放在一行中:

jurassicworld;movie;night;dino

jurassicWorld;book;yourtickets;movie

jurassicWorld;movie



我查看了Hive中的 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF,但没有函数,我可以选择定界符(;)来分隔这些主题标签并对其进行计数。

我的结果应该是这样的:
+---------------+-----------+
| Hashtag | Count |
+---------------+-----------+
| jurassicworld | 300 |
| movie | 200 |
| night | 100 |
| dino | 250 |
| book | 50 |
| etc... | 100 |
+---------------+-----------+

最佳答案

我创建了以下虚拟表熟食店-

hive> describe deli;
OK
row1 string None

我使用以下查询-
select hashTag, count(*) as data from deli LATERAL VIEW explode(split(row1,'\\;')) t1 AS hashTag group by hashTag;

而且,它为您的数据提供了以下结果-
book    1
dino 1
jurassicWorld 2
jurassicworld 1
movie 3
night 1
yourtickets 1

关于hadoop - hive -标签计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30935327/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com