performance - ARM 程序集 : Absolute Value Function: Are two or three lines faster?-6ren

performance - ARM 程序集 : Absolute Value Function: Are two or three lines faster?

转载作者：行者123 更新时间：2023-12-03 15:51:35

27

4

在我的嵌入式系统类(class)中，我们被要求将给定的 C 函数 AbsVal 重新编码为 ARM 汇编。
我们被告知我们能做的最好的是 3 行。我决心找到一个 2 线解决方案并最终做到了，但是 我现在的问题是我实际上是降低了性能还是提高了性能 .

C 代码:

unsigned long absval(signed long x){
    unsigned long int signext;
    signext = (x >= 0) ? 0 : -1; //This can be done with an ASR instruction
    return (x + signet) ^ signext;
}

助教/教授的三线解决方案

ASR R1, R0, #31         ; R1 <- (x >= 0) ? 0 : -1
ADD R0, R0, R1          ; R0 <- R0 + R1
EOR R0, R0, R1          ; R0 <- R0 ^ R1

我的 2 线解决方案

ADD R1, R0, R0, ASR #31 ; R1 <- x  + (x >= 0) ? 0 : -1
EOR R0, R1, R0, ASR #31 ; R0 <- R1 ^ (x >= 0) ? 0 : -1

有几个地方我可以看到潜在的性能差异:

添加一个额外的算术右移调用

删除一次内存获取

那么，哪一个实际上更快？它取决于处理器或内存访问速度吗？

最佳答案

这是另外两个指令版本:

    cmp     r0, #0
    rsblt   r0, r0, #0

转换为简单的代码:

  if (r0 < 0)
  {
    r0 = 0-r0;
  }

该代码应该非常快，即使在 Cortex-A8 和 A9 等现代 ARM-CPU 内核上也是如此。

关于performance - ARM 程序集 : Absolute Value Function: Are two or three lines faster?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16499475/

27

4

0

文章推荐： optimization - 通过 Fortran 中的静态变量实现性能

文章推荐： r - 从数值向量中采样等距点

c# 程序集， friend 程序集
C#内部访问修饰符的定义是内部:只能在包含程序集或友元程序集内访问。所以我的问题是什么是 C# 程序集？在包含程序集或 friend 程序集之内是什么意思？它是否意味着在同一个命名空间或项目中？最佳
c# - 程序集 + 元数据 + 程序集 list + MSIL 代码
任何人都可以回答以下问题。我正在使用 c# 语言。我可以将程序集调用为 .ddl 或 .exe 文件吗？我可以将 Assembly Manifest 称为程序集吗？程序集、元数据和程序集 lis
c# - 从 Python 运行 .NET COM 程序集。程序集 dll 的 Python 路径？
我正在从 Python 运行一个 .NET COM 程序集，只有当我将程序集 dll 和依赖项复制到我的 Python 根路径 c:\Python27 时才能使它正常工作。这是不整洁的，所以我想将
程序集 - 读取虚拟磁盘的下一个扇区
作为世界上任何一名程序员，他/她一生中至少有一次，我正在尝试创建我的“革命性”，新的且唯一的操作系统。 :D 好吧，我正在使用虚拟模拟器(Oracle VM Virtual Box)，为此我创建了一个
程序集:数组写入问题
我创建了以下程序来读取 5 个数字，然后 dumpreg查看输入的数字... INCLUDE Irvine32.inc .data count = 5 scor
程序集 - 权限级别
如何在保护模式下执行 IN 和 OUT 等受限指令？我发现它需要足够高的特权级别(CPL)才能执行 IO 指令。我怎样才能在内核模式下运行，拥有 IO 权限或任何其他可能对我有帮助的东西？ - 我希
C#程序集、模块和类型概念及关系
目录 C# 程序集、模块和类型概念及关系概述程序集模块类型程序集、模块和类型的关系总结引用
maven 程序集，如果找不到文件则失败
构建 maven assembly ，我留下了这样的东西: ${project.basedir} / LICENS
.net - 程序集/目录的延迟加载
我的应用程序由几个核心程序集和几个扩展/插件程序集组成。为了让 MEF 知道插件必须提供的所有部件，即使我永远不会使用它们的任何部件，我也必须加载这些程序集。这使得应用程序需要更多时间来启动(如果我要
Maven 程序集 - 从存档中提取时仅从子文件夹复制文件
我对我们的构建基础结构有一个非常具体的要求，即将另一个 JAR 依赖项的一些内容复制到我的 Web 应用程序的特定子文件夹中。我们正在使用 maven-assembly-plugin，一个自然的方法是
程序集 x86 标志标志
为什么下面的指令会设置符号标志？ mov al,0FEh sub al,2 据我了解，AL寄存器可以保存2^8 - 1或255。0FEh = 254(十进制)。减去 2 叶 252。这似乎是正数。 (
未找到 NUnit 程序集
我以前使用过 NUnit，但已经有一段时间了，而且从来没有在这台机器上使用过。我在 Program Files 下解压了 2.4.8 版本，并且在尝试加载测试时不断收到此错误。 Could not l
调试由嵌入式单声道运行时启动的 C# 程序集？
我说的是一个使用 C# 进行游戏编程的小型游戏引擎。所以，我有一个嵌入单声道运行时的 C++ 应用程序(我称之为“启动器”)。我有一个用 C# 编写的程序集，它是我的游戏引擎类库。启动器按照 Embe
程序集 EAX 寄存器行为异常
我对汇编相当陌生，并尝试从标准输入读取值(从 C 调用 scanf 函数)并将其打印回标准输出(使用 printf)。 .text readstr: .asciz "%d" #strin
程序集 imul 签名
谢谢帮助，我的问题是关于从下面的代码中收到的 ax 值？ mov al,22h mov cl,0fdh imul cl 真机结果:ff9a 我的预期:00:9a(通过二进制相乘) 第一个数字是 22h
程序集 8086 - 将一个缓冲区复制到另一个缓冲区
我正在开发一个汇编程序，该程序将整个文本文件读入缓冲区，然后将其显示在控制台中。它立即显示 24 行(每行的最大长度为 80，因为我使用 80 宽 * 25 高的 dossbox )然后等待用户输入，
程序集 BIOS 调用不起作用
我正在使用一个简单的程序集片段，使用 BIOS 作为引导加载程序的一部分将字符打印到屏幕上。这是引导加载程序代码。 [org 0x7c00] [bits 16] %include "a20_check
程序集 8086 - 异或操作
我只是想知道这段代码是什么意思: XOR EAX,EBX XOR EBX,EAX XOR EAX,EBX 最佳答案那是 xor swapping . 在寄存器上执行它不会遇到常见的难看的失败案例。
在运行时找不到 C# 程序集
我在新电脑上的 XNA 项目开始出现奇怪的错误。我有两个关于解决方案的项目和一个由它们使用的库。其中一个项目，一个 XNA 游戏项目，运行完美。另一个项目是 WindowsForm 和 XNA 的混合
c - 程序集-从字符数组中获取符号标签？
是的，我正在努力实现类似的目标 __asm__(jmp label;); 其中 label 应替换为内存中保存的字符串值(结构体的字段)。有没有办法做到这一点(或类似的方法可以让我跳转到运行时确定的

首页

博学

6Ren·AI

商城

performance - ARM 程序集 : Absolute Value Function: Are two or three lines faster?