gpt4 book ai didi

c++ - Visual Studio 2012不同的值发行/ Debug模式

转载 作者:IT老高 更新时间:2023-10-28 12:37:29 25 4
gpt4 key购买 nike

在调试和 Release模式之间切换时,此代码在MSVS 2012,Windows 7中产生不同的值:

#include <iostream>
using namespace std;

int A[20000];

int main() {

int shift = 0;
int Period = 30;
//Fill array
for(int i = 0; i < 20000; i++) {
A[i] = i * 2 + 123;
}

int sumTotal = 0;
int sum = 0;

for(int bars = Period + 10; bars < 1000; bars++) {
sum = 0;
for(int i = 0; i< Period; i++) {
sum += A[bars - i];
}
sumTotal += sum;
}
cout << sumTotal << endl;
}

您可以复制或找到原因吗?我一直在对项目属性的所有设置进行测试。
  • 调试(正确的结果):32630400
  • 发行:32814720
  • /GS /GL /analyze- /W3 /Gy /Zc:wchar_t /I"C:\Program Files (x86)\Visual Leak Detector\include" /Z7 /Gm- /O2 /Fd"Release\vc110.pdb" /fp:precise /D "WIN32" /D "NDEBUG" /D "_CONSOLE" /D "_UNICODE" /D "UNICODE" /errorReport:prompt /WX- /Zc:forScope /Gd /Oy- /Oi /MD /Fa"Release\" /EHsc /nologo /Fo"Release\" /Fp"Release\Testing.pch"

    最佳答案

    我使用VS2012 C编译器测试了代码的“精简”版本

    int main()
    {
    int A[12] = { 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1 };

    int sum = 0;
    int i;

    for (i = 0; i < 12; ++i)
    sum += A[11 - i];

    printf("%d\n", sum);

    return 0;
    }

    我在x64模式下编译了它,针对速度进行了优化。该错误仍然存​​在,但是根据其他优化和代码生成设置,它会以不同的方式展现自己。一个版本的代码生成“随机”结果,而另一个版本一致地生成 8作为总和(而不是适当的 12)。

    这就是持续生成 8的版本的生成代码
    000000013FC81DF0  mov         rax,rsp  
    000000013FC81DF3 sub rsp,68h
    000000013FC81DF7 movd xmm1,dword ptr [rax-18h]
    000000013FC81DFC movd xmm2,dword ptr [rax-10h]
    000000013FC81E01 movd xmm5,dword ptr [rax-0Ch]
    000000013FC81E06 xorps xmm0,xmm0
    000000013FC81E09 xorps xmm3,xmm3

    for (i = 0; i < 12; ++i)
    000000013FC81E0C xor ecx,ecx
    000000013FC81E0E mov dword ptr [rax-48h],1
    000000013FC81E15 mov dword ptr [rax-44h],1
    000000013FC81E1C mov dword ptr [rax-40h],1
    000000013FC81E23 punpckldq xmm2,xmm1
    000000013FC81E27 mov dword ptr [rax-3Ch],1
    000000013FC81E2E mov dword ptr [rax-38h],1
    000000013FC81E35 mov dword ptr [rax-34h],1
    {
    sum += A[11 - i];
    000000013FC81E3C movdqa xmm4,xmmword ptr [__xmm@00000001000000010000000100000001 (013FC83360h)]
    000000013FC81E44 paddd xmm4,xmm0
    000000013FC81E48 movd xmm0,dword ptr [rax-14h]
    000000013FC81E4D mov dword ptr [rax-30h],1
    000000013FC81E54 mov dword ptr [rax-2Ch],1
    000000013FC81E5B mov dword ptr [rax-28h],1
    000000013FC81E62 mov dword ptr [rax-24h],1
    000000013FC81E69 punpckldq xmm5,xmm0
    000000013FC81E6D punpckldq xmm5,xmm2
    000000013FC81E71 paddd xmm5,xmm3
    000000013FC81E75 paddd xmm5,xmm4
    000000013FC81E79 mov dword ptr [rax-20h],1
    000000013FC81E80 mov dword ptr [rax-1Ch],1
    000000013FC81E87 mov r8d,ecx
    000000013FC81E8A movdqa xmm0,xmm5
    000000013FC81E8E psrldq xmm0,8
    000000013FC81E93 paddd xmm5,xmm0
    000000013FC81E97 movdqa xmm0,xmm5
    000000013FC81E9B lea rax,[rax-40h]
    000000013FC81E9F mov r9d,2
    000000013FC81EA5 psrldq xmm0,4
    000000013FC81EAA paddd xmm5,xmm0
    000000013FC81EAE movd edx,xmm5
    000000013FC81EB2 nop word ptr [rax+rax]
    {
    sum += A[11 - i];
    000000013FC81EC0 add ecx,dword ptr [rax+4]
    000000013FC81EC3 add r8d,dword ptr [rax]
    000000013FC81EC6 lea rax,[rax-8]
    000000013FC81ECA dec r9
    000000013FC81ECD jne main+0D0h (013FC81EC0h)
    }

    printf("%d\n", sum);
    000000013FC81ECF lea eax,[r8+rcx]
    000000013FC81ED3 lea rcx,[__security_cookie_complement+8h (013FC84040h)]
    000000013FC81EDA add edx,eax
    000000013FC81EDC call qword ptr [__imp_printf (013FC83140h)]

    return 0;
    000000013FC81EE2 xor eax,eax
    }
    000000013FC81EE4 add rsp,68h
    000000013FC81EE8 ret

    代码生成器和优化器遗留下很多奇怪的,看似不必要的Mumbo-jumbo,但是该代码的作用可以简要描述如下。

    有两种独立的算法可以用来产生最终的总和,显然可以对数组的不同部分进行处理。我猜想有两个处理流程(非SSE和SSE)用于通过指令流水线提升并行性。

    一种算法是简单循环,该循环将数组元素求和,每次迭代处理两个元素。可以从上面的“交错”代码中提取它,如下所示
    ; Initialization
    000000013F1E1E0C xor ecx,ecx ; ecx - odd element sum
    000000013F1E1E87 mov r8d,ecx ; r8 - even element sum
    000000013F1E1E9B lea rax,[rax-40h] ; start from i = 2
    000000013F1E1E9F mov r9d,2 ; do 2 iterations

    ; The cycle
    000000013F1E1EC0 add ecx,dword ptr [rax+4] ; ecx += A[i + 1]
    000000013F1E1EC3 add r8d,dword ptr [rax] ; r8d += A[i]
    000000013F1E1EC6 lea rax,[rax-8] ; i -= 2
    000000013F1E1ECA dec r9
    000000013F1E1ECD jne main+0D0h (013F1E1EC0h) ; loop again if r9 is not zero

    该算法开始从地址 rax - 40h添加元素,在我的实验中,该地址等于 &A[2]并向后进行两次迭代,从而跳过了两个元素。这会在寄存器 A[0]中累积 A[2]r8的总和,并在寄存器 A[1]中累积 A[3]ecx的总和。因此,算法的这一部分处理数组的4个元素,并在 2r8中正确生成值 ecx

    该算法的另一部分使用SSE指令编写,显然负责对数组的其余部分求和。可以从以下代码中提取它
    ; Initially xmm5 is zero
    000000013F1E1E3C movdqa xmm4,xmmword ptr [__xmm@00000001000000010000000100000001 (013F1E3360h)]
    000000013F1E1E75 paddd xmm5,xmm4

    000000013F1E1E8A movdqa xmm0,xmm5 ; copy
    000000013F1E1E8E psrldq xmm0,8 ; shift
    000000013F1E1E93 paddd xmm5,xmm0 ; and add

    000000013F1E1E8A movdqa xmm0,xmm5 ; copy
    000000013F1E1E8E psrldq xmm0,4 ; shift
    000000013F1E1E93 paddd xmm5,xmm0 ; and add

    000000013F1E1EAE movd edx,xmm5 ; edx - the sum

    该部分使用的通用算法很简单:将值 0x00000001000000010000000100000001放入128位寄存器 xmm5中,然后将其右移8个字节( 0x00000000000000000000000100000001),并将其添加到原始值中,生成 0x00000001000000010000000200000002。再次将其右移4个字节( 0x00000000000000010000000100000002),并再次添加到先前的值,从而生成 0x00000001000000020000000300000004。将 0x00000004的最后32位字 xmm5作为结果,并将其放入寄存器 edx中。因此,该算法产生 4作为其最终结果。很明显,该算法只是在128位寄存器中执行连续32位字的“并行”加法。注意,顺便说一句,该算法甚至没有尝试访问 A,而是从编译器/优化器产生的嵌入式常量开始求和。

    现在,最后将 r8 + ecx + edx的值报告为最终总和。显然,这只是 8,而不是正确的 12。看起来这两种算法之一忘记做一些工作。我不知道是哪一个,但是从大量“冗余”指令来看,它看起来像是SSE算法应该在 8中生成 edx而不是 4。一个可疑的指令是这个
    000000013FC81E71  paddd       xmm5,xmm3  

    那时 xmm3始终包含零。因此,该指令看起来完全多余且不必要。但是,如果 xmm3实际上包含另一个“魔术”常量,表示数组的另外4个元素(就像 xmm4一样),则该算法将正常工作并产生适当的总和。

    如果对数组元素使用独特的初始值
    int A[12] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 };

    可以清楚地看到,第一个(非SSE)算法成功求和 1, 2, 3, 4,而第二个(SSE)算法求和 9, 10, 11, 125, 6, 7, 8仍然排除在考虑范围之外,导致 52作为最终总和而不是正确的 78

    这绝对是编译器/优化器错误。

    P.S.导入到VS2013 Update 2中的具有相同设置的相同项目似乎没有受此错误困扰。

    关于c++ - Visual Studio 2012不同的值发行/ Debug模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24143211/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com