- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
内联汇编代码在for循环之一内替换了C++语句。
有时,它神奇地起作用并产生正确的结果-用基数排序的数组。另外一次Xcode生成Thread 1: EXC_BAD_ACCESS (code=1, address=0x1eccccccccd)
错误,我使用反汇编 View 追溯到incq (%[count], %%rdx, 4)
行。
我所了解的
反汇编将incq (%[count], %%rdx, 4)
视为incq (%rax,%rdx,4)
。这可能意味着同一个寄存器用于不同的操作数(%%rax
行上已经使用了movq (%[array], %%rcx, 4), %%rax
),问题出在这里:: [array] "r" (array), [count] "r" (count), "b" (digit), "c" (i)
。
我不懂的
如何管理寄存器,以便我有足够的空间来使用(分配给输入操作数,以及稍后在主体代码中使用),并且它们不会同时重叠。我尝试了几种组合,但没有一种有效。
void countingSort(int array[], int length, int digit) {
int i, count[10] = { };
int sorted[length];
// Store number of occurrences in count[].
// for (i = 0; i < length; i++)
// count[ (array[i] / digit) % 10 ]++;
for (i = 0; i < length; i++)
asm volatile (
"movq (%[array], %%rcx, 4), %%rax \n\t"
"xorq %%rdx, %%rdx \n\t"
"divq %%rbx \n\t"
"movq $10, %%rbx \n\t"
"xorq %%rdx, %%rdx \n\t"
"divq %%rbx \n\t"
"incq (%[count], %%rdx, 4) \n\t"
:: [array] "r" (array), [count] "r" (count), "b" (digit), "c" (i)
: "memory"
);
// ...
}
#include<iostream>
using namespace std;
void print(int array[], int length) {
for (int i = 0; i < length; i++)
cout << array[i] << " ";
}
int findMax(int array[], int length) {
int max = array[0];
for (int i = 1; i < length; i++)
if (array[i] > max)
max = array[i];
return max;
}
void countingSort(int array[], int length, int digit) {
int i = 0, count[10] = { };
int sorted[length];
// Store number of occurrences in count[].
// for (i = 0; i < length; i++)
// count[ (array[i] / digit) % 10 ]++;
for (i = 0; i < length; i++)
asm volatile (
"movq (%[array], %%rcx, 4), %%rax \n\t"
"xorq %%rdx, %%rdx \n\t"
"divq %%rbx \n\t"
"movq $10, %%rbx \n\t"
"xorq %%rdx, %%rdx \n\t"
"divq %%rbx \n\t"
"incq (%[count], %%rdx, 4) \n\t"
:: [array] "r" (array), [count] "r" (count), "b" (digit), "c" (i)
: "memory"
);
// Change count[i] so that count[i] now contains actual
// position of the digit in sorted[].
// for (i = 1; i < 10; i++)
// count[i] += count[i - 1];
for (i = 1; i < 10; i++)
count[i] += count[i - 1];
// Build the sorted array.
for (i = length - 1; i >= 0; i--) {
sorted[count[ (array[i] / digit) % 10 ] - 1] = array[i];
count[ (array[i] / digit) % 10 ]--;
}
// Copy the sorted array to array[].
for (i = 0; i < length; i++)
array[i] = sorted[i];
}
void radixSort(int array[], int length) {
// Maximum number helps later when counting number of digits.
int max = findMax(array, length);
// Do Counting sort for every digit.
for (int digit = 1; max / digit > 0; digit *= 10)
countingSort(array, length, digit);
}
int main() {
int array[] = { 2, 4928, 48, 72, 280, 4, 66, 3, 1, 0, 4829 };
int length = sizeof(array) / sizeof(array[0]);
radixSort(array, length);
print(array, length);
return 0;
}
最佳答案
看来这是给 class 分配的。在现实世界中this would not be done with inline assembly。
问题:
digit
。 C++编译器不知道这一点,因为您没有提到在约束中修改RBX。内联汇编之前和之后,编译器可能会假定RBX是相同的。 i
转换为long
类型。在64位代码中,long
是64位,并且在汇编模板中被引用时,默认情况下将使编译器使用64位寄存器。 asm (
"movslq (%[array], %[index], 4), %%rax \n\t"
"cdq \n\t" /* Sign extend eax into edx */
"idivl %[digit] \n\t" /* array[i]/digit */
"cdq \n\t" /* Sign extend eax into edx */
"idivl %[divisor] \n\t" /* (array[i] / digit) mod 10 */
"incl (%[count], %%rdx, 4)"
: "=m" (*(int (*)[]) count) /* instead of memory clobber */
: [divisor] "r" (10), [array] "r" (array), [count] "r" (count),
[digit] "r" (digit), [index] "r" ((long)i),
"m" (*(const int (*)[]) array) /* instead of memory clobber */
: "rax", "rdx", "cc"
);
volatile
。
array[i]
。由于EAX现在处于其自身的输入/输出约束中(使用
+
),我们可以将其从Clobbers中删除。代码如下所示:
int curval;
asm (
"cdq \n\t" /* Sign extend eax into edx */
"idivl %[digit] \n\t" /* array[i]/digit */
"cdq \n\t" /* Sign extend eax into edx */
"idivl %[divisor] \n\t" /* (array[i] / digit) mod 10 */
"incl (%[count], %%rdx, 4)"
: "=m" (*(int (*)[]) count), /* instead of memory clobber */
"+&a" (curval = array[i]) /* Early clobber, we modify it
before all inputs processed */
: [divisor] "r" (10), [array] "r" (array), [count] "r" (count),
[digit] "r" (digit), [index] "r" ((long)i)
: "rdx", "cc"
);
asm volatile (
"movl (%[array], %%rcx, 4), %%eax \n\t"
"xorq %%rdx, %%rdx \n\t"
"divq %%rbx \n\t"
"movq $10, %%rsi \n\t"
"xorq %%rdx, %%rdx \n\t"
"divq %%rsi \n\t"
"incl (%[count], %%rdx, 4) \n\t"
:: [array] "r" (array), [count] "r" (count), "b" (digit), "c" ((long)i)
: "memory", "rax", "rdx", "rsi"
);
digit
的寄存器的问题,方法是使用另一个寄存器存储10进行除法。如果优化编译器假定寄存器的值未更改,则将仅列出为输入约束的寄存器进行修改可能会导致 undefined 的行为。编译器必须知道已更改的内容。 "cc"
破坏者。如果模板确实破坏了标记,则将"cc"
指定为破坏者不是坏主意,就像该代码中的情况一样。如果有什么习惯,那么如果您曾经在处理器列表中明确指定要修改的标志的处理器上工作,则应该养成这种习惯。 volatile
修饰符。 关于sorting - 重叠寄存器错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48854260/
我在玩一些代码挑战时发现自定义排序(排序接口(interface)的实现)比仅针对 slice 的原始结构要快得多。这是为什么?将 slice 转换为类型是否会产生一些魔力(例如转换为指向结构的指针
我正在使用 simple-import-sort eslint 插件进行 react 。我想我的 .eslintrc.js是对的,但我无法使这个特定的插件工作。我在文件的第一行收到以下错误: 未找到规
Closed. This question is not reproducible or was caused by typos。它当前不接受答案。 想改善这个问题吗?更新问题,以便将其作为on-to
好的,所以我是 Go 的新手,我正在努力让自己熟悉按函数排序。我可能误解了什么,所以如果我错了请纠正我。 我正在尝试创建一个包含字段 key 和 value 的 Nodes 数组。我想创建一个自定义排
我想从惰性列表中取出 n 个最大的元素。 我听说在 Data.List.sort 中实现的合并排序是惰性的,它不会产生不必要的元素。就比较而言,这可能是正确的,但在内存使用方面肯定不是这样。下面的程序
这个问题已经有答案了: Javascript sort function. Sort by First then by Second (10 个回答) 已关闭 3 年前。 我正在尝试返回已排序产品的列
我有一个 vector 对,如下所示。第一对值未排序,第二对值已排序(从零开始)。我可能想通过实现 std::vector 和 std::pair 来存储数据。当我有第一对值(未排序)时,找到相应的第
直到现在(Swift 2.2)我一直愉快地使用来自 this answer 的代码- 它迅速,优雅,它像梦一样工作。 extension MutableCollectionType where Ind
我在我的 Go 应用程序中实现排序界面时遇到问题。这是相关代码: type Group struct { Teams []*Team } type Team struct { Point
我很好奇 Lua 的默认算法是什么 table.sort使用,只是因为它比我遇到的其他一些排序算法慢。我也很好奇 Lua 的 table.sort是在引擎中用 C 编写的,或者如果它在 Lua 中的库
例如,插入排序被描述为部分排序数组的有效算法。但如何精确定义“部分排序”呢? 最佳答案 这是一个只有少数元素不合适的数组。如果没有指定百分比或其他阈值,则部分排序和未排序之间没有严格的区别。 正式定义
我是 GPU 编程的新手。最近,我正在尝试根据一个教程实现gpu bvh构建算法:http://devblogs.nvidia.com/parallelforall/thinking-parallel
有人可以指导我 Gnumeric 排序函数的详细说明(链接)吗? Gnumeric 手册很简短并且没有示例。我无法通过搜索引擎找到任何合适的信息,甚至 Stackoverflow 上也只有六个不合适的
在 Python 中使用什么精确规则来对列表进行排序,其中元素是列表?这可以表示为“key”或“cmp”吗功能?问题来自于有两件事考虑:长度和它们位置的值。 sorted([ [ 0, 1, 2
下面的代码应该创建一个整数数组 (a) 并对它进行排序,但是 sort.Sort 似乎没有修改变量。 package main import ( "fmt" "sort" ) type
我有一个应用于结构的自定义排序函数。完整代码是 here on play.golang.org . type Stmt struct { Name string After []st
python3 sorted取消了对cmp的支持。 python3 帮助文档: ?
以下是来自普林斯顿的 coursera 算法类(class)的练习。 如果一个数组既是 3 次排序又是 5 次排序,那么它是否也是 6 次、7 次、8 次、9 次和 10 次排序?我知道任何序列如果先
当我看到上面的语句时,我正在阅读 shell-sorting。这意味着什么?它对我看待 shell 排序的方式有何不同? PS:我不是在寻找声明的证据。 最佳答案 好吧,你可能暗示下一个排序阶段不会“
今天在检查mysql服务器的时候提示Sort aborted: Out of sort memory, consider increasing server sort buffer size,安装字
我是一名优秀的程序员,十分优秀!