gpt4 book ai didi

sql - 在不同组中的数据类型之间进行比较时,如何处理潜在的数据丢失

转载 作者:行者123 更新时间:2023-12-02 19:54:53 24 4
gpt4 key购买 nike

背景:
我们的小组正在将Cloudera升级到6.1.1,我的任务是确定如何处理跨数据类型的隐式数据类型转换的丢失。有关发行说明的详细信息,请参见下面的链接。

https://docs.cloudera.com/documentation/enterprise/6/release-notes/topics/rg_cdh_611_incompatible_changes.html#hive_union_all_returns_incorrect_data

此问题不仅会影响UNION ALL查询,而且还有一个函数可以对不同数据类型(即STRING到BIGINT)的列进行比较。

该小组已决定我们不想更改基础表元数据。因此解决方案是通过使用CAST()函数强制转换数据来允许潜在的数据丢失。对于UNION ALL,我们将其转换为目标表的元数据。但是,在进行比较时,我试图确定最简单,最简单的方法进行比较而不会得到错误的结果。

问题:

执行比较时,是否可以将所有内容都简单地转换为STRING或VARCHAR()?是否存在任何可能导致错误结果的潜在问题?

更新:
如果此方法有问题,是否有正确的解决方案来解决?

注意:这是我第一次与Hadoop / HIVE合作,并且了解到我在RDBMS Realm 中所了解的一切并不总是适用。

最佳答案

您可能会遇到问题。例如,如果将字符串与int进行比较,则:

  • '1.00' = 1-> true,因为将值作为数字进行比较

  • 但是作为字符串:
  • '1.00' = '1'->否,因为将值作为字符串进行比较

  • 我想您会在日期上遇到类似的问题。

    关于sql - 在不同组中的数据类型之间进行比较时,如何处理潜在的数据丢失,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58227352/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com