- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我想为 armv6 构建我的库,如果设备支持,我会在运行时启用一些 neon 代码。 neon 代码使用 neon 内在函数,为了能够编译它,我必须启用 armeabi-v7a,但这会影响常规的 c 代码(它在某些低端设备上会损坏)。
所以,如果 android 构建系统没有过度侵入,我就不必问问题了,但我似乎没有办法为 armv6 编译一个文件,为 arm7-neon 编译另一个文件。
如果可行,有人可以提供任何线索吗?
编辑
在试图回复和浪费网络墨水之前,应该清楚这些是要点:
1)只制作一个库。
2) 构建在 armv6 上运行的版本(pre neon 设备,例如 armeabi)。
3) 允许此构建也包含 NEON 代码(可以基于运行时 cpu 检测执行;cpu 检测不在问题范围内)。
4) NEON 代码来自 c/cpp 文件,使用 neon 内在函数编写。
省略这些要求的任何部分就完全失去了问题的重点
最佳答案
我最近找到了另一种解决 NDK 限制的方法。我的案例与 NEON 无关,但对您来说,同样的 hack 可以完成这项工作。
技巧是利用NDK现有的“标签”机制为一堆文件指定特殊的CFLAGS
。这是你如何做的:
首先,列出特定于 NEON 的来源。您不能使用 docs/CPU-ARM-NEON.html 中描述的 .neon
后缀因为 build-binary.mk 会发现您的目标不是 armeabi-v7a。我使用以下技术:
LOCAL_NEON_SRC_FILES := imgproc/neon_utils.c \
videoproc/usingneon.cpp
LOCAL_SRC_FILES := main.c \
imgproc/img.c \
videoproc/video.cpp
LOCAL_SRC_FILES += $(LOCAL_NEON_SRC_FILES)
现在,为 NEON 定义 CFLAGS
:
LOCAL_NEON_CFLAGS := -mfloat-abi=softfp -mfpu=neon -march=armv7
最后,将下面神奇的一行添加到您的 Android.mk 中:
TARGET-process-src-files-tags += $(call add-src-files-target-cflags, $(LOCAL_NEON_SRC_FILES), $(LOCAL_NEON_CFLAGS))
如果要构建多个二进制文件,您可能希望 $(LOCAL_NEON_SRC_FILES)
由
include $(CLEAR_VARS)
为此,将以下内容添加到您的 Android.mk
或 Application.mk
:
modules-LOCALS += NEON_SRC_FILES
注意:我还没有为 NEON 尝试过这种魔法,我需要它来实现完全不同的目的。您可能需要进行一些调整才能为您的文件和项目实现所需的编译选项。我正在使用 NDK r.8b,但我没有检查这是否适用于早期(或更高)版本。
关于Android 构建系统,NEON 和非 NEON 构建,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7679363/
用 ARM-NEON 编码的计算密集型算法的最佳指令吞吐量是多少? 例如,如果我有一个基于大量 8 位 -> 8 位操作的简单算法,那么可以维持的最快执行速度(以每个周期的 8 位操作衡量)是多少我们
我想为 armv6 构建我的库,如果设备支持,我会在运行时启用一些 neon 代码。 neon 代码使用 neon 内在函数,为了能够编译它,我必须启用 armeabi-v7a,但这会影响常规的 c
我正在寻找使用 NEON 内在函数测试 128 NEON 寄存器是否包含全零的最快方法。 我目前正在使用 3 个 OR 操作和 2 个 MOV: uint32x4_t vr = vorrq_u32(v
“无法加载JNI共享库“C:\ Program Files(x86)\ Java \ jre1.8.0_131 \ bin \ client \ jvm.dll” 我该如何解决此错误 最佳答案 是否根
实际上,我正在尝试找出一种比较从“unsigned short”数组加载的 NEON 寄存器值的好方法。由于我正在处理一个大型项目,因此无法解释共享整个代码部分。相反,我将分享一个类似的例子,以便每个
NEON 怎么会和 C 一样慢? 我一直在尝试构建一个快速直方图函数,通过为输入值分配一个值(这是它们最接近的范围阈值),将输入值分入范围。这是应用于图像的东西,因此它必须很快(假设图像数组为 640
我的 Zynq-7000 ARM Cortex-A9 处理器同时具有 NEON 和 VFPv3 扩展,Zynq-7000-TRM 表示处理器配置为具有“VFPv3 和高级 SIMD 指令的独立管道”。
我正在编译以下 ARM NEON 内在测试代码(在 Eclipse 和 Android NDK 中): void foo(uint64_t* Res) { uint64_t x = 0xff1
我是 NEON 内部函数(A9 处理器)的新手。 我想将 uint8x16_t 转换为 int32x4_t 值。我尝试使用 vreinterpret_s32_u8 来这样做,但没有用。 有人可以指导我
Eclipse Neon 在启动期间显示错误消息框并且不会打开。该消息提供了日志文件的文件路径。在该文件中,我看到此错误消息: !ENTRY org.eclipse.e4.ui.workbench.s
我有一个简单的单极低通滤波器(用于参数平滑),可以用以下公式解释: y[n] = (1-a) * y[n-1] + a * x[n] 如何在 ARM Neon 上有效矢量化这种情况 - 使用内在函数?
我用 polymer 构建了一个小型网络应用程序,并使用 NEON 动画。我想在特定动画(例如英雄动画和波纹动画)的自动测试中测量 fps。neon-animation中是否有animationEnd
有没有办法在保存文件时识别 Eclipse 发生了什么? 我的 Eclipse 运行速度非常慢(保存文件需要近 3 分钟)。只需在文件中添加一个空格并保存,它就会一直显示“正在更新导航器内容查看器”和
Eclipse Neon 启动后不到两分钟就不断卡住。没有显示错误消息或异常,工作台只是停止响应。 .log 文件中有无数异常,例如: !ENTRY org.eclipse.ui 4 4 2016-0
如何禁用 Eclipse Neon 中的欢迎屏幕? 虽然有 similar question for Eclipse Juno ,但建议的方法似乎在 Eclipse Neon 中不起作用。 我发现的一
我需要在 Neon 中实现以下循环。 int jump=4,c[8],i; //c[8] may be declared here int *src,sum=0; //**EDIT:** src p
这个问题在这里已经有了答案: arm neon compare operations generate negative one (2 个答案) 关闭 6 年前。 根据 Neon 文档: 如果一条车
假设我在 neon 中有一个 64 位 d 寄存器。假设它存储值 ABCDEFGH。现在我想添加 A&E、B&F、C&G、D&H 等等。这里是否有任何内在的东西可以进行这样的操作 我查看了文档,但没有
我正在努力将下面的代码翻译成 Neon Assembly。任何帮助将不胜感激。 void sum(int length, int *a, int *b, int *c, int *d, char *r
我试图改进一些代码,但我做不到,所以我在这里寻求帮助,我也尝试过使用内在函数,但是如果你想使用内在函数,你需要使用 GCC 编译器,这个编译器编译速度较慢比 LLVM,那么所有的代码都会变慢,所以最好
我是一名优秀的程序员,十分优秀!