gpt4 book ai didi

hadoop - Hive 更新效率(版本 0.14)

转载 作者:可可西里 更新时间:2023-11-01 16:11:36 26 4
gpt4 key购买 nike

Hive 如何高效处理未分区列的更新?

假设我想为特定的 transactionid(未分区)更新一行,Hive 将如何在内部处理它。据我了解,Hive 将首先搜索它(这很慢),然后更新存储包含此 transactionid 的特定行的特定分区(如果有的话)。尽管这将为用户提供更新数据的抽象,但执行大量更新真的有效吗?

最佳答案

行级更新在 hadoop 中可能效率不高,因为 hadoop 是为大数据处理而设计的。但是,从 Hive 版本 0.14 开始支持对支持 ACID 的 Hive 表进行行级更新。查看 Hive 教程以获取有关如何实现行级别更新的更多详细信息。 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML#LanguageManualDML-Update

关于hadoop - Hive 更新效率(版本 0.14),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29815992/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com