- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我明白,空间和时间的局部性对性能有巨大的影响。我不明白的是我的数据结构是如何存储在这些缓存中的?
为简单起见,假设 L1 缓存有 8 个字节,L2 有 16 个字节,L3 缓存有 32 个字节。
这是否意味着如果我们有:
std::array<double, 1> x = {1.};
std::array<double, 2> y = {1.,2.};
std::array<double, 4> z = {1.,2.,3.,4.};
std::array<std::array<double,2>,2> z;
std::array<std::array<double,8>,2> u;
最佳答案
您正在以错误的方式考虑缓存。
您只能使用特殊工具(想到英特尔调试器)查看哪个缓存具有它们,结果将特定于您的运行和架构。更改处理器可以很容易地破坏您的设置。
也就是说,您可以尝试使用缓存友好的解决方案。
缓存的工作方式是这样的:说你想读你 x[0]
.您的程序将请求与其关联的内存位置。它将被L1拦截。如果 L1 可以为您提供值(因为它已经存储在一个块中),它会。如果不是,请求将被 L2 拦截,依此类推。如果没有缓存级别具有该块,则将从 RAM 中请求该块。
现在,从 RAM 中仅读取 4 个字节是低效的,因为存在开销。所以实际上你将从 ram 中读取一个 L3 块,其中包括你想要的字节。您可能必须读取 2 个块,因为您的数据在它们之间拆分(编译器试图避免这种情况)。将 L2 块大小的块发送到 L2 缓存进行存储,将 L1 大小的块发送到 L1,所有这些都包括您想要的字节(字节可能位于中间某处)。对于下一个请求(比如“x[1]”),同样的事情发生。如果下一次访问接近最后一次,那么您可能会从 L1 获得结果。我说可能是因为您的程序可能已在具有不同 L1 的不同内核或处理器上暂停和恢复。
尝试针对特定设置进行设计通常是一个坏主意(除非您确实需要最后几%的性能并且您已经尝试了其他所有方法)。
经验法则是继续访问彼此相邻的内存。要避免的是访问相距很远的几个字节。遍历数组非常快。尝试在同一个排序数组上实现线性搜索和二分搜索,看看数组需要多长时间才能从二分搜索中获得显着更好的性能(上次我去了大约 100 个整数)。
在您的示例中,如果您首先访问 x
的所有元素然后转到 y
等等设置都很好。如果您正在访问 x[i], y[i], z[i]
然后 x[i+1], y[i+1], z[i+1]
那么也许有一个带有 {x,y,z} 的结构并将其放在数组中会更好(您需要进行基准测试才能确定)。
And some function calls these arrays, will x be loaded in the L1 cache, y in L2 and z in L3? Or will y - for example be splitted over the L1 and L2 caches??
Will splitting these arrays manualy yield better cache localitly?
What about cachelines? these are usualy 64 bytes long - Will splitting my arrays into arrays of arrays of 64 bytes yield better access speed?
关于c++ - 我如何知道我的阵列存储在哪个缓存级别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61982901/
Android 项目中最低(最低 sdk)和最高(目标 sdk)级别是否有任何影响。这些东西是否会影响项目的可靠性和效率。 最佳答案 没有影响,如果您以 SDK 级别 8 为目标,那么您的应用将以 9
我将现有的 android 项目升级到 API 级别 31。我使用 Java 作为语言。我改变了 build.gradle compileSdkVersion 31 defaultConfig {
我正在使用 ionic 3 创建一个 android 应用程序,当我尝试上传到 playstore 时,我收到一个错误,提示我的应用程序以 api 25 为目标,当我检查我的 project.prop
我刚刚尝试将应用程序的目标和编译 API 级别更新为 29 (Android 10),并注意到我无法再编译,因为 LocationManager.addNmeaListener 只接受 OnNmeaM
我的代码没有在 Kitkat 上显示工具栏。 这是我的两个 Android 版本的屏幕截图。 Kitkat 版本: Lollipop 版: 这背后的原因可能是什么。 list 文件
我正在构建面向 API 级别 8 的 AccessabilityService,但我想使用 API 级别 18 中引入的功能 (getViewIdResourceName())。这应该可以通过使用 A
当我想在我的电脑上创建一个 android 虚拟机时,有两个选项可以选择目标设备。它们都用于相同的 API 级别。那么我应该选择哪一个呢?它们之间有什么区别? 最佳答案 一个是基本的 Android,
当我选择 tagret 作为 Android 4.2.2(API 级别 17)时,模拟器需要很长时间来加载和启动。 所以我研究它并通过使用 找到了解决方案Intel Atom(x86) 而不是 ARM
我有一个使用 Android Studio 创建的 Android 项目。我在项目中添加了一些第三方依赖项,但是当我尝试在 Android Studio 中编译时,我遇到了以下错误: Error:Ex
如上所述,如何使用 API 8 获取移动设备网络接口(interface)地址? 最佳答案 NetworkInterface.getInetAddresses() 在 API8 中可用。 关于andr
我想显示 Snackbar并使用图像而不是文本进行操作。 我使用以下代码: val imageSpan = ImageSpan(this, R.drawable.star) val b
我有一个用 python 编写的简单命令行程序。程序使用按以下方式配置的日志记录模块将日志记录到屏幕: logging.basicConfig(level=logging.INFO, format='
使用下面的代码,实现游戏状态以控制关卡的最简单和最简单的方法是什么?如果我想从标题画面开始,然后加载一个关卡,并在完成后进入下一个关卡?如果有人能解释处理这个问题的最简单方法,那就太好了! impor
我想创建一个可以找到嵌套树结构深度的属性。下面的静态通过递归找出深度/级别。但是是否可以将此函数作为同一个类中的属性而不是静态方法? public static int GetDepth(MenuGr
var myArray = [{ title: "Title 1", children: [{ title: "Title 1.1", children: [{
通过下面的代码,实现游戏状态来控制关卡的最简单、最容易的方法是什么?如果我想从标题屏幕开始,然后加载一个关卡,并在完成后进入下一个关卡?如果有人可以解释处理这个问题的最简单方法,那就太好了! impo
我有一个树结构,其中每个节点基本上可以有无限个子节点,它正在为博客的评论建模。 根据特定评论的 ID,我试图找出该评论在树中的深度/级别。 我正在关注 this guide that explains
考虑任何给定的唯一整数的数组,例如[1,3,2,4,6,5] 如何确定“排序度”的级别,范围从 0.0 到 1.0 ? 最佳答案 一种方法是评估必须移动以使其排序的项目数量,然后将其除以项目总数。 作
我如何定义一个模板类,它提供一个整数常量,表示作为输入模板参数提供的(指针)类型的“深度”?例如,如果类名为 Depth,则以下内容为真: Depth::value == 3 Depth::value
我的场景是:文件接收器应该包含所有内容。另一个接收器应包含信息消息,但需要注意的是 Microsoft.* 消息很烦人,因此这些消息应仅限于警告。两个sink怎么单独配置?我尝试的第一件事是: str
我是一名优秀的程序员,十分优秀!