- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 neon 在 iPhone 4 上实现点积函数。基于本教程:http://www.delmarnorth.com/microwave/requirements/neon-test-tutorial.pdf我在 XCode 4.5 中尝试了以下操作。当我设置 nruns=1 时,它起作用,即,我从 neon 得到与标准 C++ 版本相同的答案。然而,当我设置 nruns > 1 时,某些东西会被损坏,并且会出现垃圾(例如,如果我在第一次调用 dotProduct() 后打印出 a 数组的元素,它们就会被损坏)。我必须承认我没有使用 NEON 的经验,但我所需要的只是能够做这个点积!有人有什么想法吗?
float dotProduct ( float *a, float *b, int n) {
float sum=0.0f;
__asm__ volatile (
"vmov.f32 q8, #0.0 \n\t"
"vmov.f32 q9, #0.0 \n\t"
"1: \n\t"
"subs %3, %3, #8 \n\t"
"vld1.f32 {d0,d1,d2,d3}, [%1]! \n\t"
"vld1.f32 {d4,d5,d6,d7}, [%2]! \n\t"
"vmla.f32 q8, q0, q2 \n\t"
"vmla.f32 q9, q1, q3 \n\t"
"bgt 1b \n\t"
"vadd.f32 q8, q8, q9 \n\t"
"vpadd.f32 d0, d16, d17 \n\t"
"vadd.f32 %0, s0, s1 \n\t"
: "=w"(sum)
: "+r"(a), "+r"(b), "+r"(n)
: "q0", "q1", "q2", "q3", "q8", "q9");
return sum;
}
void test_dotProduct_neon()
{
int n=16, i, k;
int nruns = 2;
float dp;
float *a = new float[n];
float *b = new float[n];
for (i=0; i < n; i++) {
a[i] = (float) i;
b[i] = (float) (2*i);
}
for (i=0; i<nruns; i++) {
dp=0.0f;
for( k=0; k < n; k++) {
dp += a[k] * b[k];
}
}
printf(" C Result: %f\n", dp );
for (i=0; i<nruns; i++) {
dp = dotProduct( a, b, n);
}
printf(" Neon Result: %f\n", dp );
}
最佳答案
您的 NEON 代码会修改指针“a”和“b”,因为您的加载指令 (vld1) 会递增地址寄存器(这就是地址后面的“!”的作用)。
据推测,发生的情况是编译器没有意识到这些值可能会改变,因此您的代码第二次使用虚假的指针值。
您确实用“+”标记了这些内联汇编输入,这意味着“输入/输出操作数”,但我认为您需要将它们列出在输出操作数部分中,而不是在>输入第二个操作数才能起作用。您的代码应为
: "=w"(sum), "+r"(a), "+r"(b), "+r"(n)
: /* No inputs */
: "q0", "q1", "q2", "q3", "q8", "q9"
此外,输入、输出和破坏寄存器的集合不是不相交的!将寄存器标记为破坏并不会阻止编译器将其用作输入寄存器 AFAIR,因为它假设输入在破坏发生之前被消耗。现在,由于您的输入是 ARM 寄存器,而被破坏的寄存器是 NEON 寄存器,因此您应该是安全的如果对于输出与被破坏的寄存器来说情况并非如此。我建议您检查http://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html可以肯定的是。
编辑:即使 sum
碰巧存在于一个被破坏的寄存器中,您的代码似乎也是正确的,因为您从未读过它,所以它只在最结尾。当我写上面的警告时,我错过了这一点。
编辑:您的内联程序集将指针 a
和 b
传递,而不是作为内存区域(带有 m
-约束),但作为通用寄存器中的普通值。因此,编译器不知道您实际上正在从这些内存位置读取数据,因此可能会错误地将汇编 block 移过其他存储区到这些位置。现在,由于您的内存区域具有可变大小,因此您无法轻松使用m
-Constraints,因为它们假设大小是静态确定的。相反,您可以将 "memory"
添加到 clobber 列表中,该列表告诉编译器汇编 block 可以从任意内存位置读取和写入。当您这样做时,您还应该添加“cc
”,因为您的汇编 block 会修改条件代码寄存器(包含测试指令结果的寄存器)。输入/输出声明如下所示
: "=w"(sum), "+r"(a), "+r"(b), "+r"(n)
: /* No inputs */
: "q0", "q1", "q2", "q3", "q8", "q9", "cc", "memory"
在编写内联汇编 block 时,请始终记住编译器不会、绝对不会查看此类 block 的内容。它是有关 block 行为和数据依赖性的唯一信息来源是声明的输入和输出操作数以及声明的破坏列表。编译器在优化时会积极使用这些信息,尤其是使用 -O2
或更高版本进行编译时。因此,这些声明中的任何遗漏都可能导致编译器生成不正确的代码。
关于iphone - iPhone 4 和 XCode 4 上的 NEON 点产品出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12611977/
如果我使用 NSUserDefaults 存储应用程序的设置,是否有任何方法可以使我的应用程序的设置“隐藏”,以免显示在 iPhone 上的常规设置应用程序中?我知道还有其他工具,例如 mySetti
我按照该网站的教程进行操作: http://theappleblog.com/2008/08/04/tutorial-build-a-simple-rss-reader-for-iphone/ 为了制
我通过 localisableString 和仅适用于 NSLocale 方法的不同 xib 更改 iPhone 的语言来完成本地化,但应用程序的要求是通过更改应用程序设置 View 中的语言来本地化
我试图弄清楚 iPhone 是否可以通过无线或蓝牙连接到另一台非 iPhone 设备,但发现了相互冲突的信息。我发现的大部分内容都是在 SDK 3.0 版本发布之前发现的,当时这肯定是不可能的。查看堆
This question already has answers here: Closed 7 years ago. Possible Duplicate: How to detect iPhone
当我在模拟器上运行我的应用程序时,每次都会生成白色的空白屏幕。但是当我在底部黑色 iPhone 按钮退出应用程序后,重新进入应用程序后 View 将可见。然后应用程序照常运行。 但是当我将它加载到我的
我的意思是两台 iPhone 设备应该通过蓝牙或 WiFi 连接,并且一台设备的 UI 应该扩展到另一台 iPhone 设备(不共享屏幕)。我们有办法在 iOS 中执行此操作吗? 最佳答案 Bump
如何通过宏检测设备型号?我使用过类似的东西,但模拟器上的结果总是 IS_IPHONE_5 #define IS_IPAD (UI_USER_INTERFACE_IDIOM() == UIUserInt
我目前有一个应用程序要求用户维护 VPN 隧道。加载时我检查 VPN 隧道是否可用。 我想知道是否有任何方法可以显示 UIAlertView,单击“确定”后,用户将进入 iPhone 主设置屏幕,以便
我正在开发一个 iPhone 客户端应用程序,它允许用户对各种服务进行评分。无需注册或登录。 要求是用户不能重复对服务进行评分(尽管可以更改其评分)。从目前的情况来看,该应用程序可以被删除、重新安装,
比如说,我点击一个 iphone 应用程序图标,启动时它将创建一个 .app 文件。那么是否可以从该应用程序调用另一个 iphone 应用程序。或者我们可以在该 .app 文件中执行一些操作,例如它将
真的有可能让iPhone静音模式独立于iPhone App吗? 这个应用程序"Talking Carl"让我很困惑。我的 iPhone 处于静音模式。每当我打开这个应用程序时。应用程序声音处于开启模式
这个问题不太可能对任何 future 的访客有帮助;它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关,通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用,visit the
如果我想编写一些自定义 iPhone 应用程序,但不一定通过 App Store 分发它们,是否可以在不加入 iPhone 开发者计划的情况下实现? 假设我只是想为自己编写一些小实用程序并将其放入我的
人们对 Unity 或 Torque Engine 等游戏引擎有何看法和/或体验?如果您是 iPhone 游戏开发新手,是否值得学习其中一种引擎?这些引擎生成的应用程序与使用 sdk 的 native
您能否在未安装 XCode 开发工具的计算机上分发 iPhone 应用程序以在 iPhone 模拟器中进行测试?可以直接在电脑上安装模拟器进行测试吗? 我有一组测试人员,他们不是开发人员,除了能够运行
我想在我的越狱设备上构建并安装我的应用程序,而无需支付 iPhone 开发者计划所需的 99 美元。我有 Rock 和 Cydia...最简单的方法是什么(如果可能的话)? 谢谢。 最佳答案 这是一个
我想测试一个网站,看看它如何与 iPhone 配合使用,但我没有 iPhone 或 iPod touch。有没有一种方法可以让我在不拥有网站的情况下测试网站的运行情况? 我真正想要的是修复 Stack
简单地说;我的 99 美元能给我带来什么我无法免费获得的东西? 好吧,好吧,听起来是个愚蠢的问题,但苹果网站对我来说并不清楚。 我的预感是,您可以在 99 岁时向应用程序商店提交应用程序,但您可以免费
我是一名注册的 iOS 开发人员。如何将我的 iPhone 应用程序转移到我的个人 iPhone? 最佳答案 用于测试?只需选择您的设备而不是模拟器即可。 关于iphone - 如何将我的 iPhon
我是一名优秀的程序员,十分优秀!