gpt4 book ai didi

android - GCC 发出 ARM idiv 指令(续)

转载 作者:太空狗 更新时间:2023-10-29 12:43:20 25 4
gpt4 key购买 nike

我想知道这是否适用于 Krait 400 CPU。我听从了一些建议 here

当我使用 mcpu=cortexa15 编译时,代码会编译并有效地在程序集转储中看到 udiv 指令。

但是,我想知道:

  1. 是否可以让它与 march=armv7-a 一起工作? (不指定 cpu;这是我原来的方式)
  2. 我尝试使用 mcpu=krait2,但由于我没有使用金鱼草 llvm(我还不知道这需要多少努力)它无法识别它。是否可以从 llvm 获取 cpu 定义并以某种方式使其可供我的编译器使用?
  3. 还有其他方法/补丁/技巧吗?

我的编译选项如下:

 /development/android-ndk-r8e/toolchains/arm-linux-androideabi-4.7/prebuilt/linux-x86_64/bin/arm-linux-androideabi-gcc  -DANDROID -DNEON -fexceptions -Wno-psabi --sysroot=/development/android-ndk-r8e/platforms/android-14/arch-arm -fpic -funwind-tables -funswitch-loops -finline-limit=300 -fsigned-char -no-canonical-prefixes -march=armv7-a -mfloat-abi=softfp -mfpu=neon -fdata-sections -ffunction-sections -Wa,--noexecstack  -marm -fomit-frame-pointer -fstrict-aliasing -O3 -DNDEBUG

我得到的错误是:

Error: selected processor does not support ARM mode `udiv r1,r1,r3'

作为旁注,我不得不说我才刚刚开始理解整个方案,因此我想逐步了解我在做什么。

提前致谢。

编辑 1:

我尝试编译一个单独的模块,只包含 udiv 指令。该模块使用 -mcpu=cortex-a15 参数编译,而应用程序的其余部分使用 -march=armv7-a 参数编译。结果是(不知何故)函数调用开销影响了应用程序的时间性能。我无法获得内联代码,因为尝试进入内联导致了与我最初遇到的错误相同的错误。在尝试重新发明轮子之前,我将切换到 Snapdragon 看看是否有更好的性能。感谢大家的回答和提示。

最佳答案

idiv - 一个混合体,表示支持 sdivudiv 是一个可选的 Cortex-A 指令. Cortex-A 的支持可以通过 ID_ISAR0 cp15 寄存器查询,位 [27:24]。

  /* Get idiv support. */
unsigned int ISAR0;
int idiv;
__asm ("mrc 15, 0, %0, c0, c2, 0" :"=r" (ISAR0));
#ifdef __thumb2__
idiv = (ISAR0 & 0xf000000UL) ? 1 : 0;
#else
idiv = (ISAR0 & 0xf000000UL) == 0x2000000UL ? 1 : 0;
#endif

位 [27:24] 是 0001,如果只有 thumb2 支持 udivsdiv 指令。如果 [27:24] 位是 0010,那么两种模式都支持指令。

因为 gcc 标志 -march=armv7-a 等意味着代码应该在这种类型的 ALL CPU 上工作并且这条指令是可选的,它会是gcc 发出此指令的错误。

您可以使用不同的标志编译不同的模块,例如,

gcc -march=armv7-a -o general.o -c general.c 
gcc -mcpu=cortex-a15 -D_USE_IDIV_=1 -o fast_idiv.o -c fast_div.c

这些模块可以链接在一起,上面的代码可以用来在运行时选择一个合适的例程。例如,两个文件可能都有,

  #include "fir_template.def"

这个文件可能有,

#ifdef _USE_IDIV_
#define _FUNC(x) idiv_ ## x
#else
#define _FUNC(x) x
#endif

int _FUNC(fir8)(FILTER8 *filter, SAMPLE *data,)
{
....
}

如果您知道您的代码只能在 Cortex-a15 上运行,请使用 -mcpu 选项。如果您希望它运行得更快 IF 它可以并且是通用的(支持所有 armv7-a CPU),那么您必须如上所述识别 CPU 并动态选择代码。

附录:上述文件(general.cfast_idiv.c)可以放在具有相同 API 的单独共享库中。然后询问/proc/cpuinfo 并查看是否支持idiv。将 LD_LIBRARY_PATH(或 dlopen())设置为适当的版本。选择将取决于涉及的代码量。

关于android - GCC 发出 ARM idiv 指令(续),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22012960/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com