- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
This维基百科页面提到了不同数学运算的计算复杂性,包括加法、减法、乘法和除法。我想重点介绍这四个。
首先,每个提到的操作都将其复杂性指定为数字位数的函数。这是否意味着在真实硬件上添加任意两个 int64_t
将花费相同的时间?
这是一个重要的方面,因为它会让攻击者获得一些信息,例如来自纯粹观察加密/解密方的 key 。
添加两个 int32_t
会比添加两个 int64_t
快两倍吗?
此外,乘法和除法运算有多种算法。其中哪些用于现实生活中的处理器?我们知道渐近复杂性,但也有常数,这很重要。
IMUL
指令的英特尔软件开发人员手册没有提及实际使用的算法,只是简单地指出:
TMP_XP ← DEST ∗ SRC
整个问题一开始都与 x86_64 架构有关,但如果有任何其他架构(ARM、Aarch64、POWER)使用与 x86 不同的技术,我会很感兴趣。
最佳答案
Does that mean that on real hardware adding any two
int64_t
s will take the same amount of time?
如果 CPU 有一个 64 位宽的 ALU ,是的。
我这样定义它是因为仍在设计具有 32 位或更小 ALU 的“现代”处理器,主要用于嵌入式市场。
it would allow an attacker to gain some information about e.g. cryptographic keys from sheer observing the encrypting/decrypting party.
我不确定基于时间的侧信道攻击是否像您问题的前提那样工作。如果与该处理器的真正 64 位版本相比,给定处理器上的 64 位数学运算需要多次运算,则整个算法中的所有整数数学运算都会变慢,因此攻击者将要学习的是他们在功能较弱的处理器上运行它。
由于指令执行率而导致侧信道泄漏的地方是你有 if/else 分支的地方,并且一个分支比另一个分支花费的时间更长,因此从统计上讲,攻击者可以探测以确定哪些输入导致执行更多 if
子句而不是 else
子句,从而收集一些关于 key 或其他信息的信息。
Will adding two
int32_t
s take twice shorter than adding twoint64_t
s?
不一定。 64 位处理器可能会同时运行这两种添加。
如果您想问这是否会发生在 32 位处理器上,那么答案是“可能会”,但实际上,您需要在处理器数据手册中查找这些内容。这将为您提供每条指令的时间信息。
您的问题指定了四种不同的架构,您至少缺少一个关键架构(32 位 x86,仍然存在),并且您还缺少其他几个可能的架构。 (例如 MIPS。)我不准备仔细阅读所有可能的处理器手册并为您查找。
The Intel Software Developer manual for the
IMUL
instruction doesn't mention the actual algorithm used
不,但它应该以时钟周期数给出计时信息。
可能不会这么简单地说,因为pipelining , caching这也起到了作用。
I'd be interesting if any other architectures (ARM, Aarch64, POWER) use some different techniques than x86.
当然。这方面没有硬性规定。
例如,像 ARM 这样的 RISC 处理器往往需要至少 4 条指令来执行任何类似乘法的操作,因为它们需要一个读取-计算-存储周期,因为所有数学运算都必须在处理器的寄存器中进行。 (读取操作数 1,读取操作数 2,相乘,存储产品。)
对比通常具有内存寻址模式的 CISC 处理器,其中乘法指令可以编码为“将内存位置 A 与内存位置 B 相乘并存储在内存位置 C”。操作数仍然需要加载到 CPU 中并相乘,结果仍然需要存储,但它看起来像一条指令。
CISC 模型还掩盖了 DRAM 读取延迟、缓存时序问题等问题,RISC 模型使这些问题更加明确。
曾几何时,处理器非常简单,您可以轻松回答这样的问题,但我们已经过了几十年。
关于algorithm - 现代处理器如何进行整数算术运算?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45238077/
我为 4 套接字服务器的大对象( double 矩阵)编写 NUMA-aaware 缓存。我观察到套接字间通信是我的应用程序的瓶颈。因此,我希望不同套接字上的线程具有单独的矩阵缓存。我已将线程限制到特
这个问题在这里已经有了答案: 关闭 12 年前。 Possible Duplicate: Parsing JSON using C? 处理 JSON 的最佳 C 库是什么? http://www.j
我一直在使用递归 SpinTax 处理器,如 here 所示, 它适用于较小的字符串。然而,当字符串超过 20KB 时,它开始耗尽内存,这就成了一个问题。 如果我有这样的字符串: {Hello|How
C# 中是否有一个#define 允许我在编译时知道我是针对 x86 (Win32) 还是针对 x64 (Win64) 进行编译? 最佳答案 默认情况下没有办法做到这一点。原因是 C# 代码不是针对特
我不确定 SO 是否是提出这个问题的最佳场所。如果没有,请告诉我应该去哪个姊妹网站。 我一直在阅读一篇关于英特尔的可信执行技术 (TXT) 的论文,其中包含以下我似乎无法理解的文字: “英特尔创建了一
我需要一个工具来针对 执行 XSLT非常大 XML 文件。需要明确的是,我不需要任何东西来设计、编辑或调试 XSLT,只需执行它们即可。我正在使用的转换已经很好地优化了,但是大文件导致我尝试过的工具(
我正在学习Apache Camel。 能否请您解释一下关于Apache Camel的处理器,组件和端点之间的区别。 最佳答案 我建议所有刚接触Apache Camel的人阅读这篇文章,它很好地解释了C
我想知道在 Camel 处理器上获得同步的方法。 我在 docs 找到的唯一相关内容: Note that there is no concurrency or locking issue when
我看到这个 https://issues.apache.org/jira/browse/NIFI-78在 jira 上,但它引用了 java。有没有办法将 nifi 进程映射到服务器上的线程,以便我可
我有以下用例: 在一个应用程序中,我使用 X 线程消费一些消息,其中我有一个这样定义的 Consumer 实现: public interface Consumer { onMessage(
CPU12 处理器中是否有提供简单 NOT 功能的代码? 最佳答案 这应该是 the datasheet您正在寻找。没有可用的logical NOT,您必须自己编写代码。 关于assembly - 不
我对 Oracle XDK 中包含的 Java XSLT 处理器与 Oracle DB 中嵌入并由 SQL XMLtransform 函数使用的 XSLT 处理器之间的关系感到困惑。 这些是相同的野兽
我正在试用 Camel,发现它是一个方便的端点集成工具。我已经设置了以下实验性应用程序: 第一个端点是一个简单的 http-get 请求(在命令行上使用 curl)。这与使用 Jetty 的中央交换机
我正在为一个应用程序使用 Apache Camel 和 Spring Boot。我需要从目录中读取数据,然后解码读取的 xml,然后处理解码的对象以在其中设置更多数据,然后再次对其进行编码并将其发送到
我已经知道如何编写自定义处理器(扩展org.apache.nifi.processor.AbstractProcessor)。我已经使用了这种技术,并且也可以轻松创建自定义 org.apache.ni
是否有任何用 python 编写的 EasyList 处理器/解析器? http://easylist.adblockplus.org/en/ 最佳答案 找到了!就像一个月后:( http://adb
我有一个无法安装任何东西的开发(说来话长)。我只需要使用纯 HTML/浏览器 JS 进行开发,并且我想使用 CSS 预处理器。我喜欢 SCSS (SASS),但为了使用它,我必须在我的机器上安装 ru
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
对于新手来说,是直接从 ARM 处理器的数据表和用户手册开始,还是先了解一下 ARM 世界然后再继续? 最佳答案 当我开始使用一项(对我而言)新技术时,我首先会找到尽可能多的数据表和应用说明,然后直接
我使用 AMD FX X6 6300 型处理器。 (它支持虚拟化,我的 BIOS 设置为 ON) 我安装了“英特尔 x86 仿真器加速器”。当我尝试运行 Intel 加速器设置时,我得到该设置无法安装
我是一名优秀的程序员,十分优秀!