gpt4 book ai didi

r - 对于大整数 id 数字,使用 integer64、数字或字符哪个更好?

转载 作者:行者123 更新时间:2023-12-01 23:08:28 26 4
gpt4 key购买 nike

我正在使用一个数据集,该数据集有多个表示整数 ID 号的列(例如 transactionIdaccountId)。这些 ID 号通常有 12 位数字长,这使得它们太大而无法存储为 32 位整数。

在这种情况下最好的方法是什么?

  1. 以字符串形式读取 ID。
  2. 使用 bit64 包将 ID 读取为整数 64。
  3. 将 ID 读取为数字(即 double )。

有人警告我用 double 测试相等性的危险,但我不确定在将它们用作 ID 的情况下这是否会成为问题,我可能会根据它们进行合并和过滤,但永远不会这样做ID 号的算术。

从直觉上看,字符串测试相等性和进行合并的速度应该更慢,但在实践中可能没有太大区别。

最佳答案

请参阅 Roland 对原始问题的评论。您的 ID 应该是字符向量。由于 ID 不太可能用于类似数学的运算,因此将值存储为字符向量通常更安全。他还指出,使用字符向量合并 data.table 的速度非常快。也许不如整数合并那么快,但仍然很快。在大多数情况下,这应该没问题。

关于r - 对于大整数 id 数字,使用 integer64、数字或字符哪个更好?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35171760/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com