gpt4 book ai didi

cuda - 对 GPU 内存带宽的概念理解

转载 作者:行者123 更新时间:2023-12-04 05:34:52 25 4
gpt4 key购买 nike

我对 GPU 的内存带宽的概念有点困惑。

根据 TESLA M 2090 它说的GPU规范
峰值带宽为 177.6 GB/s。

所以当人们提到带宽时,它是指

  • 单向流量的速度,如每秒字节数,可以是 阅读 ,
    来自设备
  • 双向流量的速度,如每秒可读取的字节数 写入设备内存。

  • 无论我在哪里读到这个术语,我都没有看到这个澄清

    最佳答案

    总线上只有一组导线,因此不能同时写入或读取数据。理论上带宽是一样的,总读+写==总读==总写。

    但在实践中,如果您将大量连续数据 block 写入设备,则传输效率更高,这是最常见的用法,也是系统优化的目标。

    编辑。显卡的内部内存带宽(即卡上各种组件之间的内存路径)远高于进出计算机的带宽。

    它也更复杂,有不同类型的内存以不同的方式连接到不同的处理器,制造商会选择使它听起来最高的数字 - 这个数字真的没有意义,除了比较来自同一卡的不同型号的非常相似的卡GPU 家族。

    关于cuda - 对 GPU 内存带宽的概念理解,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12095015/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com