gpt4 book ai didi

hadoop - 如何从 Hive 表中删除重复记录?

转载 作者:可可西里 更新时间:2023-11-01 14:14:16 25 4
gpt4 key购买 nike

我正在尝试学习如何从 Hive 表中删除重复记录。

我的 Hive 表:'dynpart' 列:Id、Name、Technology

Id  Name  Technology
1 Abcd Hadoop
2 Efgh Java
3 Ijkl MainFrames
2 Efgh Java

我们可以在选择查询中使用诸如“Distinct”之类的选项,但选择查询只是从表中检索数据。谁能告诉我如何使用删除查询从 Hive 表中删除重复行。

确定在 Hive 中删除/更新记录不推荐或不是标准。但我想了解我们如何做到这一点。

最佳答案

可以使用insert overwrite语句来更新数据

insert overwrite table dynpart select distinct * from dynpart;

关于hadoop - 如何从 Hive 表中删除重复记录?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43280052/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com