gpt4 book ai didi

cuda - NVIDIA Fermi 中的二级缓存

转载 作者:行者123 更新时间:2023-12-02 04:36:07 25 4
gpt4 key购买 nike

当查看 NVIDIA Fermi 架构中的性能计数器的名称(cuda 的 doc 文件夹中的文件 Compute_profiler.txt)时,我注意到对于 L2 缓存未命中,有两个性能计数器,l2_subp0_read_sector_misses 和 l2_subp1_read_sector_misses。他们说这些用于 L2 的两个切片。

为什么他们有两片 L2?与流式多处理器架构有什么关系吗?这种划分对性能有什么影响?

谢谢

最佳答案

我认为与流式多处理器没有任何直接关系。

我只是觉得slice相当于bank memory。

只需将两者的值相加即可获得“总”L2 读取未命中数。

关于cuda - NVIDIA Fermi 中的二级缓存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42432883/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com