- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想知道,例如,如果2个CPU内核尝试同时(通过内存控制器)访问内存,那么“一般”如何处理内存访问?实际上,当内核和启用DMA的IO设备尝试以相同方式进行访问时,情况相同。
I think,内存控制器足够聪明,可以利用地址总线并发地处理这些请求,但是我不确定当他们尝试访问相同的位置或IO操作垄断了地址总线并且没有足够的CPU占用空间时会发生什么情况继续。
谢谢
最佳答案
简短的回答是“它很复杂,但是在某些情况下访问肯定可以并行发生”。
我认为您的问题有点太黑白了:您可能正在寻找一个答案,例如“是的,多个设备可以同时访问内存”或“没有,它们不能”,但是现实是,首先d需要描述一些特定的硬件配置,包括一些底层实现细节和优化功能,以获得确切的答案。最后,您需要准确定义“相同时间”的含义。
通常,一个好的一阶近似值是硬件将使所有硬件似乎可以同时访问存储器,这可能是由于争用而导致等待时间的增加和带宽的减少。在非常精细的时序级别,一台设备实际上可能会推迟另一台设备的访问,也可能不会,这取决于许多因素。您极不可能需要此信息来正确实现软件,并且极不可能需要了解详细信息甚至最大化性能。
就是说,如果您真的需要了解详细信息,请继续阅读,我可以就某种理想化的latpop /台式机/服务器规模的硬件给出一些一般性的意见。
正如Matthias所述,您首先必须考虑缓存。缓存意味着任何要进行缓存的读取或写入操作(几乎包括所有CPU请求以及许多其他类型的请求)都可能根本不接触内存,因此在这种意义上,许多内核可以“访问”内存(至少是缓存)图片)同时进行。
如果然后考虑所有高速缓存级别中未命中的请求,则需要了解内存子系统的配置。通常,RAM芯片一次只能做“一件事情”(即,诸如读取和写入这样的命令适用于整个模块),并且通常扩展到由多个芯片组成的DRAM模块以及通过DRAM连接的一系列DRAM。到单个内存控制器的总线。
因此,可以说,从电气上来说,一个内存控制器及其附加的RAM的组合可能只同时执行某件事。现在,事情通常类似于从物理上连续的字节跨度中读取字节,但是该操作实际上可以帮助一次处理来自不同设备的多个请求:即使每个设备向控制器发送单独的请求,良好的实现也会将coalesce请求发送给相同或附近的内存区域。
此外,即使CPU也可能具有这样的能力:当发生新请求时,它可以/必须注意到重叠区域的现有请求正在进行中,并将新请求与旧请求绑定在一起。
不过,您可以说,对于单个内存控制器,通常一次只能处理一个设备的请求,而没有合并请求的特殊机会。现在,请求本身通常为纳秒级,因此可以在一个较小的时间单位内处理许多单独的请求,因此这种“排他性”是细粒度的,通常不会引起注意。
现在,在上面我已经小心地将讨论限制在一个内存控制器上-当您有多个内存控制器4时,即使在RAM级别,也肯定可以有多个设备同时访问内存。这里每个控制器本质上都是独立的,因此,如果来自两个设备的请求映射到不同的控制器(不同的NUMA区域),则它们可以并行进行。
那是很长的答案。
1实际上,命令流比“读”或“写”之类的命令级别更低,更复杂,并且涉及诸如打开内存页,从中传输字节流等概念。What every programmer should know about memory是该主题的出色介绍。
2例如,假设有两个对内存中相邻字节的请求:如果它们适合总线宽度,则控制器可以将它们合并为一个请求。
3当然,如果您正在多个设备上争夺内存,那么总体影响可能会非常明显:每设备带宽的减少和延迟的增加,但是我的意思是共享的粒度足够细,您可以通常,我们无法分辨细分的独占访问和某些假设设备之间的区别,该设备在每个周期中对每个请求都同时进行。
4在现代硬件上,最常见的配置是每个插槽一个内存控制器,因此在2P系统上,您通常有两个控制器,当然也可以使用其他比率(更高和更低)。
关于memory - 多核架构中的CPU和内存访问,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42403764/
在 ARM 中,内存类型指定为: 正常 设备 强烈有序 在Device type里面,好像这个类型也可以区分 不可共享的设备内存 可共享设备内存 不可共享和可共享设备内存有什么区别?我们如何分别使用这
在 ARM 中,内存类型指定为: 正常 设备 强烈有序 在Device type里面,好像这个类型也可以区分 不可共享的设备内存 可共享设备内存 不可共享和可共享设备内存有什么区别?我们如何分别使用这
This diagram很清楚不同YARN和Spark内存相关设置之间的关系,除了spark.python.worker.memory。 spark.python.worker.memory 如何适应
我正在尝试使用复杂的if-else决策树来实现GLSL片段着色器。不幸的是,着色器编译器很早就失败,并出现“语法错误-内存耗尽”错误。 GLSL中的代码大小或决策树深度是否有任何限制?有什么建议如何克
什么是“标记内存”,它如何帮助减小程序大小? 最佳答案 您可能指的是 tagged union ,或更具体地说是硬件实现,如 LISP 机器中使用的标记架构。基本上是一种存储具有类型信息的数据的方法。
我的内存有问题。我不明白为什么当我的程序长时间运行时 Go 使用越来越多的内存(从不释放它)。 第一次分配后,程序使用了将近 9 MB 的内存。然后在 12 小时后,它开始以指数方式使用更多内存,直到
在 Windows 机器上,MATLAB 用户可以使用 memory或 feature memstats命令。但是,这些都不能在机器上工作,失败如下: >> memory??? Error using
引导 Linux 内核时,可以在 RAM 中加载 initramfs 存档和 DTB 文件,并将这些物理地址指定给内核。例如,使用 U-Boot,您可以执行以下操作: bootz 0x80008000
我正在学习虚拟内存的概念,但是这个问题让我困惑了一段时间。由于大多数现代计算机都使用虚拟内存,因此当程序正在执行时,操作系统应该在 RAM 和磁盘之间将数据分页进出。但为什么我们仍然遇到“内存不足”的
我在 Colab Pro+(使用高 RAM 选项)上运行神经网络时发现了这个问题。 运行时错误:CUDA 内存不足。尝试分配 8.00 GiB(GPU 0;15.90 GiB 总容量;12.04 Gi
当我在任何地方阅读基于操作系统的书籍时,考虑到时间限制和开销很高,从内存和 I\O(子系统)获取数据是昂贵的,这就是为什么在某些硬件制造商中提供一些其他方式来访问它们,如ARM7 some ISAs像
据我所知,ADS v.10 尝试将查询结果保留在内存中,直到它变得非常大。对于 __output 表和临时表也应该如此。当结果变大时,交换声明。 问题是为查询、 worker 等设置了什么内存限制?可
序言 我正在写一个小演示文稿来列出使用 Docker 时的一些“陷阱”,我也遇到了自己的一个问题。 在解释让 Docker 在没有内存限制的情况下运行的危险时,我发现它的行为不像我预期的那样。 我使用
我们有一个 ASP.NET 项目(40 个左右的 Web 表单、50 个表、相当标准的 IO 内容,并尽可能减少),很快需要部署。系统上大约有 100 个并发用户,但任何时候只有大约 20 个用户在使
我在 dotcloud 上使用 redis 内存存储,但尽管 key 已过期,但它的 used_memory 再也不会下降。从 redis-cli 使用 flushdb 或 flushall 不会导致
我使用的是 Xcode 10.2.1 和 macOS Catalina Developer Beta 2。每当我尝试使用内存图调试器时,我都会收到此错误: Memory Graph Debugger:
所以我一直在寻找这个问题的解决方案有一段时间了。我编写了一个程序来从两个单独的文本文件中获取数据,对其进行解析,然后输出到另一个文本文件和一个 ARFF 文件以供 Weka 分析。我遇到的问题是我编写
对不起,我对 erlang 文档中的以下描述不太清楚: erlang:memory() -> [{Type, Size}] with Type: "total" means: "The total a
在查看示例合约时,有时会在带有“内存”的方法中声明数组,有时则不会。有什么区别? 最佳答案 如果没有内存关键字,Solidity会尝试在存储中声明变量。 首席 Solidity 开发者 chriset
我不明白Matlab并行计算工具箱中的parfor cicle是如何与内存一起工作的:我读到它在所有worker之间共享内存(然后我认为每个worker(核心)都可以访问感兴趣的内存位置而无需制作本地
我是一名优秀的程序员,十分优秀!