- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
高效地做 x = x*10 + 1
,这可能是最佳使用
lea eax, [rax + rax*4] ; x*=5
lea eax, [1 + rax*2] ; x = x*2 + 1
3-component LEA has higher latency在现代 Intel CPU 上,例如Sandybridge 系列上有 3 个周期与 1 个周期,所以 disp32 + index*2
比 disp8 + base + index*1
快SnB 系列,即我们关心优化的大多数主流 x86 CPU。 (这主要仅适用于 LEA,不适用于加载/存储,因为 LEA 在 ALU 执行单元上运行,而不是在大多数现代 x86 CPU 中的 AGU 上运行。)AMD CPU 的 LEA 较慢,具有 3 个组件或 scale > 1
(http://agner.org/optimize/)
但是 NASM 和 YASM 将通过使用 [1 + rax + rax*1]
来优化代码大小对于第二个 LEA,它只需要 disp8 而不是 disp32。 (寻址模式始终有基址寄存器或 disp32)。
即他们总是 split reg*2
进入base+index
,因为这对于代码大小来说是最糟糕的。
我可以强制使用 lea eax, [dword 1 + rax*2]
的 disp32 ,但这并不能阻止 NASM 或 YASM 拆分寻址模式。 NASM手册似乎没有记录使用the strict
keyword的方法在比例因子上,和 [1 + strict rax*2]
不组装。 有没有办法使用strict
或其他一些语法来强制寻址模式所需的编码?
nasm -O0
禁用优化不起作用。显然,这仅控制多 channel 分支位移优化,而不是 NASM 所做的所有优化。当然,您不想首先对整个源文件执行此操作,即使它确实有效。我仍然明白
8d 84 00 01 00 00 00 lea eax,[rax+rax*1+0x1]
<小时/>我能想到的唯一解决方法是使用 db
手动对其进行编码。这是相当不方便的。根据记录,手动编码为:
db 0x8d, 0x04, 0x45 ; opcode, modrm, SIB for lea eax, [disp32 + rax*2]
dd 1 ; disp32
比例因子编码在 SIB 字节的高 2 位中。我组装lea eax, [dword 1 + rax*4]
获取正确寄存器的机器代码,因为 NASM 的优化仅适用于 *2
。 SIB 为 0x85
,并将字节顶部的 2 位字段递减,将比例因子从 4 减少到 2。
但问题是:如何以一种易于阅读的方式编写它,以便轻松更改寄存器,并让 NASM 为您编码寻址模式?(我想一个巨大的宏可以使用文本处理和手动 db
编码来做到这一点,但这并不是我正在寻找的答案。我现在实际上不需要这个,我主要想知道 NASM 或 YASM 是否有语法来强制执行此操作.)
我知道的其他优化,例如mov rax, 1
汇编为 5 字节 mov eax,1
在所有 CPU 上都是纯粹的胜利,除非您想要更长的指令在没有 NOP 的情况下进行填充,and can be disabled与 mov rax, strict dword 1
获取 7 字节符号扩展编码,或 strict qword
对于 10 字节 imm64。
gas 不会执行此操作或大多数其他优化(仅立即数和分支位移的大小):lea 1(,%rax,2), %eax
组装成
8d 04 45 01 00 00 00 lea eax,[rax*2+0x1]
,对于 .intel_syntax noprefix
也是如此版本。
不过,MASM 或其他汇编器的答案也很有趣。
最佳答案
NOSPLIT
:
Similarly, NASM will split
[eax*2]
into[eax+eax]
because that allows the offset field to be absent and space to be saved; in fact, it will also split[eax*2+offset]
into[eax+eax+offset]
.
You can combat this behaviour by the use of theNOSPLIT
keyword:[nosplit eax*2]
will force[eax*2+0]
to be generated literally.
[nosplit eax*1]
also has the same effect. In another way, a split EA form[0, eax*2]
can be used, too. However,NOSPLIT
in[nosplit eax+eax]
will be ignored because user's intention here is considered as[eax+eax]
.
lea eax, [NOSPLIT 1+rax*2]
lea eax, [1+rax*2]
00000000 8D044501000000 lea eax,[rax*2+0x1]
00000007 8D440001 lea eax,[rax+rax+0x1]
关于assembly - 如何强制 NASM 将 [1 + rax*2] 编码为 disp32 + index*2 而不是 disp8 + base + index?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48848230/
我一直很难编辑我的 .htaccess 文件来一起做这三件事。我已经能够分别获得每个部分,但我只是不明白逻辑流程如何使它们全部工作。 这是我能够使用 bluehost support 上的演示进行整合
我制作的宏将模板工作簿保存为两个单独的文件。每个测试保存一个(位置 1、2、3 或 4),然后在另一个宏中使用每个测试的数据。第二个是保留用于备份的原始数据文件。现在的问题是每次我在每个位置运行测试并
我正在写一篇关于如何使用 OCaml 的模块系统而不是 Java 的 OO 系统(一个有趣的视角)的博客文章。我遇到了一些我不理解的关于强制的事情。下面是一个基本模块和两个包含它的模块: module
我有一段将被执行多次(5,000+)的代码,以及一个仅在第一次为真的 if 语句。我曾想过使用“FIRST”变量并每次都进行比较,但每次都检查它似乎是一种浪费,即使我知道它不需要。 bool FIRS
首先,我是 Perforce 的新手,我主要通过其文档进行学习。 因此,我们即将从 CVS 迁移到 Perforce,我最近学到了一个避免更改每个工作区的 P4CLIENT 的好方法,即在工作区根目录
我正在为一段代码编写测试,其中包含我试图涵盖的 IOException 捕获。 try/catch 看起来像这样: try { oos = new ObjectOutputStream(new
我正在尝试在新闻项目滚动之间添加延迟。我知道 $.each() 通过不等待动画完成来完成其工作,但我想知道如何制作它,以便一次向上滚动一个项目并等到最后一个动画完成后再继续在循环中。 $(functi
假设已经编写了一个方法,需要一个排序列表作为其输入之一。当然这将在代码中进行注释和记录,param 将被命名为“sortedList”,但如果有人忘记,则会出现错误。 有没有办法强制输入必须排序?我正
我正在尝试将传入请求重定向到 https://www.domain.com/和所有 https://www.domain.com/ {所有页面}并且没有什么麻烦。我试过的方法: 添加此行:Redire
我将如何实现以下内容: title_selection = raw_input("Please type in the number of your title and press Enter.\n%
我有一个登录表单,我需要强制关闭自动完成功能。我试过了 jquery: $('#login').attr("autocomplete", "off"); HTML: Javascript:docume
我想知道我应该怎么做才能强制从 dev 分支 merge 到我的 master 分支?使用“git merge dev”会导致很多冲突。但是,我不想单独处理它们。相反,我只是想使用我的 dev 分支中
当安装 Hl7.Fhir.DSTU2 和 Hl7.Fhir.R4 这两个 Nuget 包时,我们得到如下信息: DSTU2 包似乎在使用 Hl7.Fhir.Support.Poco 版本 3.4.0
我正在尝试让一个功能组件在 testFn 执行时强制重新渲染。我想使用状态来做到这一点(如果有更好的方法请说出来),这似乎成功地强制重新渲染但只有两次,然后什么都没有。 我构建了一个简单的演示来模拟这
默认情况下,g++ 似乎会省略未使用的类内定义方法的代码。示例 from my previous question : struct Foo { void bar() {} void baz(
我正在尝试使用 here 中介绍的技术使我的网站背景以比内容慢的速度滚动。我不希望背景固定,只希望更慢。 这是 HTML 的样子: .parallax { perspective: 1px;
我能找到的最相似的问题是 'how to create a row of scrollable text boxes or widgets in flutter inside a ListView?'
我有以下 eslint 配置: "object-curly-newline": ["error", { "ImportDeclaration": "never",
我正在使用 TinyMCE 插件并将 valid_elements 选项设置为: "a[href|target:_blank],strong/b,em/i,br,p,ul,ol,li" 即使没有列出数
您好,我想使用以下命令放置多行描述 p4 --field Description="MY CLN Header \\n my CLN complete description in two -thre
我是一名优秀的程序员,十分优秀!