gpt4 book ai didi

hadoop - hive 中的 wordcount 问题

转载 作者:可可西里 更新时间:2023-11-01 16:39:46 25 4
gpt4 key购买 nike

使用 hive 进行字数统计时出现问题。

我的配置单元命令是这样的

select word, count(1) as count 
from (select explode(split(word, ' ' )) as word from note) w
group by word
order by count desc
limit 5
;

结果:

the 20583
of 10388
9479
and 7611
in 5226

9479 是行数。我该如何摆脱它?

最佳答案

将split函数改成-

split(word,'\\s+')

(而不是单个空格,一个严肃的白色字符[\t\n\x0B\f\r])

关于hadoop - hive 中的 wordcount 问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43716865/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com