c++ - clflush 在 i7 中没有给出 const 数据类型的正确答案-6ren

c++ - clflush 在 i7 中没有给出 const 数据类型的正确答案

转载作者：塔克拉玛干更新时间：2023-11-03 00:59:42

25

4

我已经编写了两个程序来检查 clflush 是否正在从缓存中逐出我的数据。在我编写的两个程序中，只有一个给出了正确的结果(按照我的预期，在 clflush 之后，访问时间必须比刷新之前更长)。

这是我得到预期结果的 Program1。

#include <stdio.h>
#include <stdint.h>

inline void clflush(volatile void *p)
{
    asm volatile ("clflush (%0)" :: "r"(p));
}

inline uint64_t rdtsc()
{
    unsigned long a, d;
    asm volatile ("cpuid; rdtsc" : "=a" (a), "=d" (d) : : "ebx", "ecx"); 
    return a | ((uint64_t)d << 32);
}


static int i=10; // static variable 

inline void test()
{
    uint64_t start, end;    
    int j;    
    start = rdtsc();
    j = i;
    end = rdtsc();
    printf("took %lu ticks\n", end - start);
}

int main(int ac, char **av)
{
    test();
    test();
    printf("flush: ");
    clflush((void *)&i);
    test();
    test();
    return 0;
}

这是我的输出(符合预期)

took 314 ticks
took 282 ticks
flush: took 442 ticks
took 272 ticks

这是另一个程序，我没有得到预期的结果。

 #include <stdio.h>
 #include <stdint.h>

inline void clflush(volatile void *p)
{
    asm volatile ("clflush (%0)" :: "r"(p));
}

inline uint64_t rdtsc()
{
    unsigned long a, d;
    asm volatile ("cpuid; rdtsc" : "=a" (a), "=d" (d) : : "ebx", "ecx"); 
    return a | ((uint64_t)d << 32);
}


static const int i=10; // I make this as constant 

inline void test()
{
    uint64_t start, end;    
    int j;    
    start = rdtsc();
    j = i;
    end = rdtsc();
    printf("took %lu ticks\n", end - start);
}

int main(int ac, char **av)
{
    test();
    test();
    printf("flush: ");
    clflush((void *)&i);
    test();
    test();
    return 0;
}

这是我的输出(符合预期)

took 314 ticks
took 282 ticks
flush: took 282 ticks // same as previous
took 272 ticks


--------
took 314 ticks
took 282 ticks
flush: took 272 ticks // lower than previous
took 272 ticks

如果我让 static int i=10;进入 static const int i=10;那么结果并不符合我的预期。在 clflush 之后，我获得了更低的值(value)/平等的访问时间。

谁能解释为什么会这样？我怎样才能按照我的期望(在 clflush 之后访问时间更长)(在 C 或 C++ 中)作为程序 1)？

我在 Fedora19 linux 下使用 GCC。任何帮助将不胜感激。

最佳答案

我很确定这里的问题是 CPUID + RDTSC 与“指令之间的指令”相比太长了。

我得到非常不同的结果，大概取决于代码最终运行在哪个实际 CPU 上的“运气”，其他 CPU 正在做什么，等等。

这是第二个程序的连续三个运行:

took 92 ticks
took 75 ticks
flush: took 75 ticks
took 474 ticks

took 221 ticks
took 243 ticks
flush: took 221 ticks
took 242 ticks

took 221 ticks
took 221 ticks
flush: took 221 ticks
took 230 ticks

但是，我认为我们不能由此得出“clflush 不起作用”的结论。只是处理器中有足够的时钟周期和足够的乱序执行来克服缓存刷新并重新加载数据。

如果您有大量数据，比如几千字节，您可能会得到更明显的效果。我稍后会做一些实验，但现在我需要一些食物......

#include <stdio.h>
#include <stdint.h>

inline void clflush(volatile void *p)
{
    __asm volatile ("clflush (%0)" :: "r"(p));
}

inline uint64_t rdtsc()
{
    unsigned long a, d;
    __asm volatile ("rdtsc" : "=a" (a), "=d" (d) : : "ebx", "ecx"); 
    return a | ((uint64_t)d << 32);
}


static int v[1024]; 
uint64_t   t[5];
int        r[5];
int        ti = 0;

static inline void test()
{
    uint64_t start, end;    
    int j;    
    start = rdtsc();
    for(int i = 0; i < 1024; i++)
    {
    j += v[i];
    }
    end = rdtsc();
    r[ti] = j;
    t[ti++] = end - start;
}

int main(int ac, char **av)
{
    for(int i = 0; i < 1024; i++)
    {
    v[i] = i;
    }
    test();
    test();
    t[ti++] = 0;
    for(int i = 0; i < 1024; i+=4)
    {
    clflush((void *)&v[i]);
    }
    test();
    test();
    for(int i = 0; i < ti; i++)
    {
    if (t[i] == 0)
    {
        printf("flush\n");
    }
    else
    {
        printf("Test %lu [res=%d]\n", t[i], r[i]);
    }
    }
    printf("\n");
    return 0;
}

我将 printf 移出测试路径，以减少在那里花费的时间，并使刷新区域更大。这提供了更长的运行时间，这无疑有助于测量。

Test 2538 [res=523776]
Test 2593 [res=523776]
flush
Test 4845 [res=523776]
Test 2592 [res=523776]

Test 2550 [res=523776]
Test 2771 [res=523776]
flush
Test 4782 [res=523776]
Test 2513 [res=523776]

Test 2550 [res=523776]
Test 2708 [res=523776]
flush
Test 4356 [res=523776]
Test 2593 [res=523776]

如您所见，flush 之后，与第一次访问相比，数据的获取时间大约是原来的两倍。

编辑:

像这样使用const

static const int v[1024] = 
{
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,
    /* snip 62 lines equal to this */
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,
};

给出这个结果:

Test 14139 [res=8704]
Test 2639 [res=8704]
flush
Test 5287 [res=8704]
Test 2597 [res=8704]

Test 12983 [res=8704]
Test 2652 [res=8704]
flush
Test 4859 [res=8704]
Test 2550 [res=8704]

Test 12911 [res=8704]
Test 2581 [res=8704]
flush
Test 4705 [res=8704]
Test 2649 [res=8704]

如您所见，第三次访问明显比第二次和第四次慢。第一次访问速度较慢，因为在第一次访问时缓存中根本没有任何内容(包括页表等)。

关于c++ - clflush 在 i7 中没有给出 const 数据类型的正确答案，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21575080/

25

4

0

文章推荐： android - 未能解决依赖关系。？

文章推荐： c++ - 段错误 : stack overflow

文章推荐： android - 如何在调试中隐藏 OpenGLRenderer (android studio)

文章推荐： c++ - 无法从派生指针访问公共(public)基成员

android -/数据/数据/在哪里？
初学者 android 问题。好的，我已经成功写入文件。例如。 //获取文件名 String filename = getResources().getString(R.string.filename
安卓/数据/数据/mypackage/img
我已经将相同的图像保存到/data/data/mypackage/img/中，现在我想显示这个全屏，我曾尝试使用 ACTION_VIEW 来显示 android 标准程序，但它不是从/data/dat
ios - Swift 4:无法将“数据”类型的值转换为预期的参数类型“数据”
我正在使用Xcode 9，Swift 4。我正在尝试使用以下代码从URL在ImageView中显示图像: func getImageFromUrl(sourceUrl: String) -> UII
android - 基因运动。如何从设备中提取数据库。我的/数据/数据/文件夹似乎是空的
我的 Ubuntu 安装 genymotion 有问题。主要是我无法调试我的数据库，因为通过 eclipse 中的 DBMS 和 shell 中的 adb 我无法查看/data/文件夹的内容。没有显示
php - JSON 数据 ajax 不是正确的 POST 数据
我正在尝试用 PHP 发布一些 JSON 数据。但是出了点问题。这是我的 html -- {% for x in sets %}
r - lm(数据~时间)和tslm(数据~趋势)有什么区别
我观察到两种方法的结果不同。为什么是这样？我知道 lm 上发生了什么，但无法弄清楚 tslm 上发生了什么。 > library(forecast) > set.seed(2) > tts lm(t
Spring 数据 JPA 和 Spring 数据 Elasticsearch ；找不到类型的属性索引？
我不确定为什么会这样!我有一个由 spring data elasticsearch 和 spring data jpa 使用的类，但是当我尝试运行我的应用程序时出现错误。 Error creatin
d3.js - 数据过滤器适用于 json 数据，但不适用于 csv 数据
在 this vega 图表，如果我下载并转换 flare-dependencies.json使用以下 jq 到 csv命令， jq -r '(map(keys) | add | unique) as
php - 在 .php 文件中发送 mysql 数据/mysql 数据
我正在提交一个项目，我必须在其中创建一个带有表的 mysql 数据库。一切都在我这边进行，所以我只想检查如何将我所有的压缩文件发送给使用不同计算机的人。基本上，我如何为另一台计算机创建我的数据库文件，
android - 如何使用 Android Device Monitor 的文件资源管理器查找我的应用程序/数据/数据
我有一个应用程序可以将文本文件写入内部存储。我想仔细看看我的电脑。我运行了 Toast.makeText 来显示路径，它说:/数据/数据/我的包但是当我转到 Android Studio 的 An
android - 如何从 Genymotion 的 android 模拟器访问文件/数据/数据？
我喜欢使用 Genymotion 模拟器以如此出色的速度加载 Android。它有非常好的速度，但仍然有一些不稳定的性能。如何从 Eclipse 中的文件资源管理器访问 Genymotion 模拟器
silverlight - 如果我在 setter 中使用不同的值更改绑定(bind)数据，如何刷新绑定(bind)数据
我需要更改 Silverlight 中文本框的格式。数据通过 MVVM 绑定(bind)。例如，有一个 int 属性，我将 1 添加到 setter 中的值并调用 OnPropertyChanged
youtube - 通过 YouTube 数据 API 访问公共(public)数据，无需身份验证。
我想向 Youtube Data API 提出请求，但我不需要访问任何用户信息。我只想浏览公共(public)视频并根据搜索词显示视频。我可以在未经授权的情况下这样做吗？最佳答案 YouTube
python - 无法让 twilio 显示 'from' 数据，但它会显示 'to' 数据
我已经设置了一个 Twilio 应用程序，我想向人们发送更新，但我不想回复单个文本。我只是想让他们在有问题时打电话。我一切正常，但我想在发送文本时显示传入文本，以确保我不会错过任何问题。我正在使用 p
javascript - 向客户端发送 JSON 数据？ D3.js 渲染 JSON 数据
我有一个带有表单的网站(目前它是纯 HTML，但我们正在切换到 JQuery)。流程是这样的: 接受用户的输入 --- 5 个整数通过 REST 调用网络服务在服务器端运行一些计算...并生成一个
javascript - 如何检测一个 JavaScript 文件只包含 JSON 数据，还是打算包含 JSON 数据？
假设我们有一个名为 configuration.js 的文件，当我们查看内部时，我们会看到: 'use strict'; var profile = { "project": "%Projec
javascript - 在初始 .ajax 调用之外使用 JSON 数据 - 访问剩余的 JSON 数据
这部分是对 Previous Question 的扩展我的: 我现在可以从我的 CI Controller 成功返回 JSON 数据，它返回: {"results":[{"id":"1","Sourc
ios - 删除所有 Couchbase 数据/文档 ios(或删除所有 ios 数据？)
有什么有效的方法可以删除 ios 中 CBL 的所有文档存储？我对此有疑问，或者，如果有人知道如何从本质上使该应用程序像刚刚安装一样，那也会非常有帮助。我们正在努力确保我们的注销实际上将应用程序设置为
javascript - $.post(url, 函数(数据,状态) {警报(数据)});警报()不工作
我有一个 Rails 应用程序，它与其他 Rails 应用程序通信以进行数据插入。我使用 jQuery $.post 方法进行数据插入。对于插入，我的其他 Rails 应用程序显示 200 OK。但在
javascript - 断言错误 : expected { status: 'SUCCESS' , 数据 : [] } to equal { Object (status, 数据)}
我正在为服务于发布请求的 API 调用运行单元测试。我正在传递请求正文，并且必须将响应作为帐户数据返回。但我只收到断言错误注意:数据是从 Azure 中获取的 spec.js const accou

首页

博学

6Ren·AI

商城

c++ - clflush 在 i7 中没有给出 const 数据类型的正确答案