gpt4 book ai didi

hive - 有没有一种简单的方法来删除 Hive 表的重复数据?

转载 作者:行者123 更新时间:2023-12-04 05:03:25 24 4
gpt4 key购买 nike

我在 Elastic Map-Reduce 上有一组 Hive 表,其中有一些重复的元素。是否有一种简单的方法来删除这些表的重复数据?

想到的是转储到一组 pig 可消化的文件,启动 pig 并使用 DISTINCT 查询重新生成表。不过,这似乎需要大量工作,所以我想知道是否有更简单的方法。

最佳答案

一个查询应该删除重复项:

INSERT OVERWRITE TABLE table
SELECT DISTINCT Col1, Col2 , ..., ColN FROM table

关于hive - 有没有一种简单的方法来删除 Hive 表的重复数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15835701/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com