r - 为什么NaN和Inf-Inf的哈希值不同？-6ren

r - 为什么NaN和Inf-Inf的哈希值不同？

转载作者：行者123 更新时间：2023-12-03 11:50:46

25

4

我经常使用此哈希函数，即记录数据帧的值。想看看我能否打破它。这些哈希值为什么不相同？

这需要摘要包。

纯文本输出:

> digest(Inf-Inf)
[1] "0d59b2dae9351c1ce6c76133295322d7"
> digest(NaN)
[1] "4e9653ddf814f0d16b72624aeb85bc20"
> digest(1)
[1] "6717f2823d3202449301145073ab8719"
> digest(1 + 0)
[1] "6717f2823d3202449301145073ab8719"
> digest(5)
[1] "5e338704a8e069ebd8b38ca71991cf94"
> digest(sum(1, 1, 1, 1, 1))
[1] "5e338704a8e069ebd8b38ca71991cf94"
> digest(1^0)
[1] "6717f2823d3202449301145073ab8719"
> 1^0
[1] 1
> digest(1)
[1] "6717f2823d3202449301145073ab8719"

额外的怪异。等于NaN的计算具有相同的哈希值，但NaN的哈希值不相等:

> Inf - Inf
[1] NaN
> 0/0
[1] NaN
> digest(Inf - Inf)
[1] "0d59b2dae9351c1ce6c76133295322d7"
> digest(0/0)
[1] "0d59b2dae9351c1ce6c76133295322d7"
> digest(NaN)
[1] "4e9653ddf814f0d16b72624aeb85bc20"

最佳答案

tl; dr 这与如何用二进制表示NaN的非常详细的细节有关。您可以使用digest(.,ascii=TRUE)解决它。

跟进@Jozef的答案:注意粗体数字...

> base::serialize(Inf-Inf,connection=NULL)[1] 58 0a 00 00 00 03 00 03 06 00 00 03 05 00 00 00 00 05 55 54 46 2d 38 00 00[26] 00 0e 00 00 00 01 ff f8 00 00 00 00 00 00> base::serialize(NaN,connection=NULL)[1] 58 0a 00 00 00 03 00 03 06 00 00 03 05 00 00 00 00 05 55 54 46 2d 38 00 00[26] 00 0e 00 00 00 01 7f f8 00 00 00 00 00 00

Alternatively, using pryr::bytes() ...

> bytes(NaN)
[1] "7F F8 00 00 00 00 00 00"
> bytes(Inf-Inf)
[1] "FF F8 00 00 00 00 00 00"

Wikipedia article on floating point format/NaNs说:

Some operations of floating-point arithmetic are invalid, such as taking the square root of a negative number. The act of reaching an invalid result is called a floating-point exception. An exceptional result is represented by a special code called a NaN, for "Not a Number". All NaNs in IEEE 754-1985 have this format:

sign = either 0 or 1.

biased exponent = all 1 bits.

fraction = anything except all 0 bits (since all 0 bits represents infinity).

符号是第一位；指数是接下来的11位；分数是最后52位。将上面给出的前四个十六进制数字转换为二进制， Inf-Inf是 1111 1111 1111 0100(sign = 1；指数是所有整数，根据需要；分数以 0100开头)，而 NaN是 0111 1111 1111 0100(相同，但sign = 0)。

要了解 Inf-Inf为什么以符号位1结束而 NaN具有符号位0的原因，您可能必须更深入地研究在此平台上实现浮点算法的方式...

对此可能值得一提。我想不出一种优雅的方法，但是在R中 identical(x,y)是 TRUE的对象应该具有相同的哈希值似乎是合理的。 :

single.NA: logical indicating if there is conceptually just one numeric ‘NA’ and one ‘NaN’; ‘single.NA = FALSE’ differentiates bit patterns.

在C代码中，除非启用了按位比较，否则R似乎仅使用C的 identical()运算符比较 single.NA值，在这种情况下，它将对内存位置的相等性进行显式检查:请参阅 issue on the digest GitHub repo。也就是说，C的比较运算符似乎将不同类型的 TRUE值视为等效...

关于r - 为什么NaN和Inf-Inf的哈希值不同？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54095499/

25

4

0

文章推荐： nuget - NuGetScratch目录可以安全删除吗？

文章推荐： c - 为什么文件没有定义套接字类型？

文章推荐： c# - 好的UDP中继服务器设计

文章推荐： .net - 如何在Asp.net中使用HSL

Python: 'inf is inf' ，但 '-inf is not -inf' ？
python 3.7 在编写最大值的搜索代码时，我遇到了负无穷大的奇怪行为。有人可以解释为什么这种行为吗？ >>> inf = float('inf') >>> inf is inf True >>
julia inf by inf 不同的结果
我是 Julia 的新手 - Windows 上的 1.0.0 版。 documentation陈述如下 julia> Inf / Inf NaN 但是当我执行以下操作时，我得到了不同的结果 juli
julia inf by inf 不同的结果
我是 Julia 的新手 - Windows 上的 1.0.0 版。 documentation陈述如下 julia> Inf / Inf NaN 但是当我执行以下操作时，我得到了不同的结果 juli
ios - 具有非有限位置的子层 [inf inf]
我正在使用用 Objective-C 编写的第三个 CocoaPods 库来截取 UITextView 的屏幕截图。 iOS 8 没问题，但在我更改 iOS 9 和 Swift 2 的语法后，它会抛出
jakarta-ee - Java Web 应用程序中的 META-INF 和 WEB-INF 中的 INF 是什么？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 7 年前。
scala - 如何在 sbt 中排除 META-INF/*.RSA', 'META-INF/*.SF' ,'META-INF/*.DSA'
我已经从 Intellij 为 Spark+ scala 代码创建了 jar 并尝试在开发集群中运行该 jar，但最终出现以下错误: Exception in thread "main" java.l
java - 可以从 WEB-INF\lib\{*.jar}\META-INF\resources\WEB-INF 目录访问 tld 文件吗？
我有一个包含如下标记的 jsp 文件: 在我的应用中，部署结构是: WEB-INF |-lib |-some.jar |-META-INF
R 有没有办法找到 Inf/-Inf 值？
我正在尝试在大型数据集 (5000x300) 上运行 randomForest。不幸的是，我收到如下错误消息: > RF df2 df2 character(0) > df2 df2 numer
c - 尝试打印 "+INF"但只得到 "inf"
我想返回 +INF 但我只返回“inf”: int main(void) { double dubb = HUGE_VAL; printf("%f \n", dubb); } 我是不是
Matlab 除以 0 : Inf or -Inf
我不明白为什么在以下两种情况下除以 0 会产生不同的结果。amort 是一个计算常量摊销计划的函数。我们现在唯一关心的是 A 的最后一个元素恰好为 0。 amort = @(r,M) ((1+r).^
C IEEE-Floats inf 等于 inf
在 C 中，在使用 IEEE-754 float 的实现中，当我比较两个为 NaN 的 float 时，它返回 0 或“false”。但是为什么两个都为 inf 的 float 相等呢？这个程序打印
math - 在 rust : what is `-inf` ? 上计算时我有 `-inf`
以下代码生成结果-inf。 fn main() { println!("{}", (-10. / 0.)); } 但是，当我尝试下面的代码时，它没有打印出 true，而是给我一个错误。 fn
python - 为什么 assertAlmostEqual(-inf,-inf) 会失败？
Numpy 的 log 方法为 log(0) 提供 -inf。这个值是可比较的: >>> np.log(0) == np.log(0) True 现在在单元测试中以下工作正常: self.assert
redis zrange 与 zrangebyscore(-inf +inf)
在下一种情况下哪种方法更好: 我需要获取一些按分数排序的元素，我可以使用这两种方法: 1. zrange myZset 1 5 WITHSCORES 2. zrangebyscore myZset
java - META-INF 为什么叫 META-INF？
我正在尝试解释 Web 应用程序的基础知识。我在 META-INF 和 WEB-INF 上遇到了这个问题。这些目录是如何获得这些名称的？最佳答案 Jar 文件实际上是 ZIP 文件，带有额外的信息和
AVPlayer with sideloaded subtitles breaking when ",SUBTITLES=\"subs\"" is added to the end of the "#EXT-X-STREAM-INF:" lines(在“#EXT-X-STREAM-INF：”行的末尾添加了“#EXT-X-STREAM-INF：”行的AVPlayer，其侧面加载的字幕在以下情况下中断：“，SUBTITES=\”SUBS\“”)
我正在使用修改后的kanderson-well beats委托版本来修改AVKit需要的请求。所有代码将在帖子的底部。修改请求、创建字幕播放列表并将它们添加到主播放列表中是很好的，因为它们在请求AVM
floating-point - IEEE754 中 inf==inf 的基本原理是什么
当您有符合 IEEE754 标准的浮点实现时，与 NaN 的任何比较都是 false，即使是 NaN == NaN，但是+inf == +inf 是 true，为什么？从我的角度来看，说 +inf
r - 一种检测 NaN、NA、Inf、-Inf 等的函数？
R 中是否有一个函数可以确定值是否为 NA , NaN , Inf , -Inf ，否则不是一个格式良好的数字？最佳答案你要is.finite > is.finite(NA) [1] FALSE
inf - 如何使用 InstallShield LE 安装 INF 文件？
我们有一个应用程序，我们正在使用 InstallShield LE(Visual Studio 2010 附带的那个)来管理应用程序的安装。作为安装的一部分，我需要安装一个 INF 文件，以便应用程
tomcat - WEB-INF/类与 WEB-INF/lib
我正在将应用程序移植到 tomcat，我怀疑以下类加载可能是个问题... 如果我在 WEB-INF/classes 中有一个类需要一个在 WEB-INF/lib 中的类，他们找不到它。如果我在 WE

首页

博学

6Ren·AI

商城

r - 为什么NaN和Inf-Inf的哈希值不同？