- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前正在将算法从 C 语言重写到 arm 汇编语言(ARM Cortex M4 CPU)。
我的代码有什么作用?
该算法将一个 8 位数字作为输入,并从右边开始告诉我们第一个为 0 的位是什么。下面是几个例子:
输入:B01111111 输出:7
输入:B01110111 输出:3
输入:B11111110 输出:0
这是完成此操作的原始 C 代码:
uint8_t find_empty(uint32_t input_word)
{
for (uint8_t searches=7; searches>=0; searches--)
{
if ((input_word&1)==0)
{
return 7-searches;
}
input_word=input_word>>1;
}
return 255;
}
这是我在 ARM (Cortex M4) 程序集中重写它的初学者尝试。
.global findEmpty
findEmpty:
mov r1, r0 //Move input_word to r1
//Config
mov r0, #7 //search through 8 (7+1) bits. <-searches
FindLoop:
tst r1, #1 //ANDs input_word with 1, sets the Z flag accordingly.
beq NotFoundYet //didn't get a 0, jump forward
rsb r0, r0, #7 //searches=7-searches <- which bit is 0?
bx lr //Return found bit number
NotFoundYet:
lsr r1, r1, #1 //input_word=input_word>>1
sub r0, r0, #1 //Decrement searches
cmp r0, #0
bpl FindLoop //If searches>=0, do the loop again.
mov r0, #255 //We didn't find anything. Return 255 to signal that
bx lr
快速说明:我在这里使用 r1 作为变量,我听说你不应该这样做,因为编译器(我正在使用 gcc 将我的程序集“.S”文件链接到 C 文件)使用 r0-r3 来传递数据和接收数据功能。但是,正因为如此,它不会将这些寄存器用于重要的事情,所以我不必处理将内容插入堆栈的问题,从而节省了周期。
有什么问题?
当我尝试编译我的项目时,gcc 在 TST 行上给我一个汇编程序错误:
汇编器消息:错误:需要未移位的寄存器 -- `tst r1, #1’
这让我很困惑,因为我查看了 TST instruction 的 keil 站点和 LSR instruction我稍后会用它来将 r1 移动 1。但是他们都没有说不能一起工作。我在网上查找了有关此主题的其他讨论。我遇到了this discussion人们说告诉编译器在 ARM 模式下编译,但我的代码已经在 ARM 模式下运行,而不是 Thumb。我通过创建另一个 .global 子例程并尝试将一个大于 7 的立即数加到一个数字上来确认这一点,但确实它不起作用,就像 CPU 处于 ARM 模式时它不应该那样。
.global illegal_add
illegal_add:
add r0, r0, #20
bx lr
我知之甚少,也不知道如何尝试解决这个问题。如果有人对要尝试的事情有任何想法,请告诉我。感谢您的帮助。
最佳答案
我不是 100% 清楚问题出在哪里。您很可能忘记正确设置程序集。要解决此问题,请在文件开头发出这些指令:
.syntax unified
.cpu cortex-m4
.thumb
如果我把这些放在你的代码前面,它在我的机器上组装得很好。
一些一般提示:
lsrs r1, r1, #1
而不是 lsr r1, r1, #1
来获得 16 位指令。tst
和 cmp
指令。例如,如果您使用 subs r0, r0, #1
而不是 sub r0, r0, #1
您保存了一个字节(16 位指令)并且已经设置了 Z根据 r0
标记,为您节省后续的 cmp
指令。关于c - 需要未移位的寄存器 - 汇编器在 TST 指令上抛出错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71881625/
我无法理解如何使用一些旧的 VGA 代码在这个示例中设置序列 Controller 寄存器: mov dx,SC_INDEX mov ax,0604h out dx,ax
我希望对 zmm 0-31 寄存器集的四字元素执行整数算术运算并保留这些运算产生的进位位。看来这只有在通用寄存器集中处理数据时才有可能。 因此,我想将信息从 zmm 0-31 寄存器之一复制到通用寄存
ARM 64中包含多种寄存器,下面介绍一些常见的寄存器。 1 通用寄存器 ARM 64包含31个64bit寄存器,记为X0~X30。 每一个通用寄存器,它的低32bit都可以被访问,记为W0~W
1.寄存器 组合逻辑存在一个最大的缺点就是存在竞争与冒险,系统会产生不定态;使用时序逻辑电路就会极大的改善这种情况 寄存器具有存储功能,一般是由D触发器构成,由时钟脉冲控制,每个D触发器能够
使用 $gp 是否存在危险?注册以存储值?我想我的问题是 $gp 的真正功能是什么?它是否以某种方式在幕后调用,以便如果我使用它,事情可能会变得非常非常错误? 最佳答案 那么,$gp register
我遇到了这段代码的问题,我无法弄清楚问题出在哪里。所以当我运行这段代码时:if $row["count"] > 0 else块运行和 $_SESSION["error"]设置。 当$row["coun
所以我正在做二进制炸弹的变体。这就是阶段 0x0000000000401205 : sub $0x8,%rsp 0x0000000000401209 : cmp $0x3,
我在一个名为 (EmployeeDetailKey - varchar(10)) 的字段中获得了一个值,其中包含顺序值,例如 00001, 00002, 00003.... 它位于 Employeed
我有一个要求,应该为每个调用的线程分配一个计数器变量。但我没有得到预期的结果,实际上计数器在线程中重复。我创建了一个虚拟表和一个过程来将计数器值插入到表中。无论如何,是否可以更改代码以便线程获得递增的
预期输出:需要打印第4季度的wage_amt +--------------+--------------+--------------+--------------+ | wages_amt_q1
如何匹配模式 abc_[someArbitaryStringHere]_xyz? 为了澄清,我希望正则表达式能够匹配以下性质的字符串: abc_xyz、abc_asdfsdf_xyz、abc_32rw
从下拉列表(自定义)中选择一个值而不是常规下拉列表,它有很多下拉值 我可以用代码选择第一个值 find('.selected', :text=>arg1,exact: false).click 但无法
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
我有 .csv 文件中的数据,它包含 2 列 x 轴和 y 轴。从 .csv 文件读取轴,然后使用拉伸(stretch)指数函数拟合数据,但显示错误。 这里我给出示例数据以方便理解。 我的函数是f(x
我正在尝试使用以下汇编代码将磁盘扇区加载到内存中,但正如我在终端中使用一些 int 0x10 时发现的那样,它不起作用的原因是它陷入了无限循环。我以为循环会自动为我递减 cx 寄存器。下面是代码,其中
我正在尝试编写一个脚本,该脚本将在 vim 中打开一个文件并将其中的特定行复制到 vim 的寄存器之一中。当脚本再次运行时,它会决定再次打开文件,然后将 vim 寄存器中的值粘贴回。实际上,脚本应该在
我目前正在尝试弄清楚如何将指针寄存器 SI 指向的内存中的第一个字节添加到 AX 寄存器的当前内容中。 因此,如果 SI 包含某个地址,并且该地址在内存中的值是:00 和 01,我希望将 00 添加到
我试图将两个 16 位数字与以下 NASM 代码相乘: mov ax, [input1] mov bx, [input2] mul bx 前面代码的结果存储在 DX:AX 我试图使用来自单独库“pri
我正在尝试修改 rip 寄存器(只是为了好玩)。 buffer 应该是内存地址,所以不知道为什么会得到Error: operand type mismatch for 'movq' #include
我可以告诉gcc-style inline assembly把我的__m512i变量到特定 zmm注册,如 zmm31 ? 最佳答案 就像在根本没有特定寄存器约束的目标(如 ARM)上一样,使用 lo
我是一名优秀的程序员,十分优秀!