- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试将此C代码转换为MIPS程序集,但不确定是否正确。有人能帮我吗?请
问题:假设a,b,i和j的值分别在寄存器$ s0,$ s1,$ t0和$ t1中。同样,假定寄存器$ s2保持数组D的基地址
C代码:
for(i=0; i<a; i++)
for(j=0; j<b; j++)
D[4*j] = i + j;
add $t0, $t0, $zero # i = 0
add $t1, $t1, $zero # j = 0
L1 : slt $t2, $t0, $s0 # i<a
beq $t2, $zero, EXIT # if $t2 == 0, Exit
add $t1, $zero, $zero # j=0
addi $t0, $t0, 1 # i ++
L2 : slt $t3, $t1, $s1 # j<b
beq $t3, $zero, L1, # if $t3 == 0, goto L1
add $t4, $t0, $t1 # $t4 = i+j
muli $t5, $t1, 4 # $t5 = $t1 * 4
sll $t5, $t5, 2 # $t5 << 2
add $t5, $t5, $s2 # D + $t5
sw $t4, $t5($s2) # store word $t4 in addr $t5(D)
addi $t0, $t1, 1 # j ++
j L2 # goto L2
EXIT :
最佳答案
add $t0, $t0, $zero # i = 0
不,不会更改$t0
,保留以前所做的任何垃圾。也许您打算使用addi $t0, $zero, 0
?
此外,MIPS没有2寄存器寻址模式(用于整数加载/存储),只有16-bit-constant ($reg)
。 $t5($s2)
是非法的。您需要单独的addu
指令,或者更好的是指针增加。
(对于指针数学运算,应使用addu
而不是add
;如果地址计算从地址空间的低半到高半交叉,这不是错误。)
在C语言中,另一个线程在编写对象时正在读取对象是未定义的行为,因此我们可以优化外循环的实际循环。除非D
的类型是_Atomic int *D
或volatile int *D
,否则问题中未指定。
内部循环每次都与外部循环计数器无关地写入相同的元素,因此我们可以使用i = a-1
优化外部循环并仅执行最终的外部迭代。除非a <= 0
,否则我们必须跳过外循环主体,即不执行任何操作。
优化除最后一个商店之外的所有商店到每个位置的过程称为“消除死商店”。较早的外循环迭代中的存储是“无效”的,因为它们被覆盖而没有读取其值。
通常,您希望将循环条件放在循环的底部,因此循环分支是一个bne $t0, $t1, top_of_loop
。 (MIPS具有bne
作为本机硬件指令;除非第二个寄存器为blt
,否则$zero
只是伪指令。)所以我们想将j<b
优化为j!=b
,因为我们知道我们在计数向上。
在循环之前放置一个条件分支,以检查是否需要运行零次。例如如果blez $s0, after_loop
,则b <= 0
跳过内循环主体。
asm中惯用的for(i=0 ; i<a ; i++)
循环在C语言中看起来像这样(或对此有所变化)。
if(a<=0) goto end_of_loop;
int i=0;
do{ ... }while(++i != a);
i
,则
i=a
和
do{}while(--i)
。 (即添加
-1
并使用
bnez
)。尽管MIPS在
i!=a
上可以像在
i!=0
上一样高效地分支,但与大多数带有FLAGS寄存器的体系结构不同,在递减计数的位置保存比较指令。
D[4*j]
表示我们在一个字数组中跨了16个字节。分别使用乘以4和以2移位是疯狂的冗余。只需将指针保存在单独的寄存器中,就可以在每次迭代中将其递增16,就像C编译器一样。
D
的类型,也不知道其他任何变量。如果它们中的任何一个都是窄无符号整数,则可能需要实现8或16位截断/换行。
int
或
unsigned
,所以让我们开始吧。
i+j
以
a-1
开头(j = 0)。它最多可运行
j=b-1
,因此最大值为
a-1 + b-1
。
# int a: $s0
# int b: $s1
# int *D: $s2
# Pointer to D[4*j] : $t0
# int i+j : $t1
# int a-1 + b : $t2 loop bound
blez $s0, EXIT # if(a<=0) goto EXIT
blez $s1, EXIT # if(b<=0) goto EXIT
# now we know both a and b loops run at least once so there's work to do
addiu $t1, $s0, -1 # tmp = a-1 // addu because the C source doesn't do this operation, so we must not fault on signed overflow here. Although that's impossible because we already excluded negatives
addu $t2, $t1, $s1 # tmp_end = a-1 + b // one past the max we store
add $t0, $s2, $zero # p = D // to avoid destroying the D pointer? Otherwise increment it.
inner: # do {
sw $t1, ($t0) # tmp = i+j
addiu $t1, $t1, 1 # tmp++;
addiu $t0, $t0, 16 # 4*sizeof(*D) # could go in the branch-delay slot
bne $t1, $t2, inner # }while(tmp != tmp_end)
EXIT:
a-2
和
a+b-2
用作
tmp
和
tmp_end
的初始化程序。在某些实际的流水线/超标量MIPS CPU上,最好避免将增量放在读取它的
bne
之前。 (将指针增量移动到分支延迟插槽后)。当然,您实际上会展开以节省工作,例如使用
sw $t1, 16($t0)
和
32($t0)
/
48($t0)
。
$t0..2
的一些初始值以填充早期
blez
指令中的分支延迟时隙,因为它们不能相邻。
关于c - C编程为MIPS汇编(用于循环),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19461669/
#include using namespace std; class C{ private: int value; public: C(){ value = 0;
这个问题已经有答案了: What is the difference between char a[] = ?string?; and char *p = ?string?;? (8 个回答) 已关闭
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 7 年前。 此帖子已于 8 个月
除了调试之外,是否有任何针对 c、c++ 或 c# 的测试工具,其工作原理类似于将独立函数复制粘贴到某个文本框,然后在其他文本框中输入参数? 最佳答案 也许您会考虑单元测试。我推荐你谷歌测试和谷歌模拟
我想在第二台显示器中移动一个窗口 (HWND)。问题是我尝试了很多方法,例如将分辨率加倍或输入负值,但它永远无法将窗口放在我的第二台显示器上。 关于如何在 C/C++/c# 中执行此操作的任何线索 最
我正在寻找 C/C++/C## 中不同类型 DES 的现有实现。我的运行平台是Windows XP/Vista/7。 我正在尝试编写一个 C# 程序,它将使用 DES 算法进行加密和解密。我需要一些实
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
有没有办法强制将另一个 窗口置于顶部? 不是应用程序的窗口,而是另一个已经在系统上运行的窗口。 (Windows, C/C++/C#) 最佳答案 SetWindowPos(that_window_ha
假设您可以在 C/C++ 或 Csharp 之间做出选择,并且您打算在 Windows 和 Linux 服务器上运行同一服务器的多个实例,那么构建套接字服务器应用程序的最明智选择是什么? 最佳答案 如
你们能告诉我它们之间的区别吗? 顺便问一下,有什么叫C++库或C库的吗? 最佳答案 C++ 标准库 和 C 标准库 是 C++ 和 C 标准定义的库,提供给 C++ 和 C 程序使用。那是那些词的共同
下面的测试代码,我将输出信息放在注释中。我使用的是 gcc 4.8.5 和 Centos 7.2。 #include #include class C { public:
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我的客户将使用名为 annoucement 的结构/类与客户通信。我想我会用 C++ 编写服务器。会有很多不同的类继承annoucement。我的问题是通过网络将这些类发送给客户端 我想也许我应该使用
我在 C# 中有以下函数: public Matrix ConcatDescriptors(IList> descriptors) { int cols = descriptors[0].Co
我有一个项目要编写一个函数来对某些数据执行某些操作。我可以用 C/C++ 编写代码,但我不想与雇主共享该函数的代码。相反,我只想让他有权在他自己的代码中调用该函数。是否可以?我想到了这两种方法 - 在
我使用的是编写糟糕的第 3 方 (C/C++) Api。我从托管代码(C++/CLI)中使用它。有时会出现“访问冲突错误”。这使整个应用程序崩溃。我知道我无法处理这些错误[如果指针访问非法内存位置等,
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我有一些 C 代码,将使用 P/Invoke 从 C# 调用。我正在尝试为这个 C 函数定义一个 C# 等效项。 SomeData* DoSomething(); struct SomeData {
这个问题已经有答案了: Why are these constructs using pre and post-increment undefined behavior? (14 个回答) 已关闭 6
我是一名优秀的程序员,十分优秀!