gpt4 book ai didi

c++ - GTX 460 (GF104) 比 GT 740m (GK107) 快,为什么?

转载 作者:行者123 更新时间:2023-11-28 06:40:15 25 4
gpt4 key购买 nike

<分区>

我在我的 GT 740m (GK107) 上运行 gSLIC 分割算法,分割需要 93 毫秒。来自 gSLIC 报告 http://www.robots.ox.ac.uk/~carl/papers/gSLIC_report.pdf我知道他们使用的是 GTX 460 (GF104),他们的分割需要 13 毫秒

GK107 架构在两个 SMX 中有384 个 cuda 核心,而 GF104 在七个 SM 中有336 个 cuda 核心。取决于算法(共享内存占用)我计算出我的 GK107 能够在一个 SMX 上运行 1280 个事件线程,总的来说 2x1280 = 2560 事件线程是多少,而 GF104 能够在一个 SM 上运行 1280 个事件线程,总共有 7x1280 = 8960 个事件线程。但是 GF104 的 cuda 内核比 GK107 少,所以它应该同时处理更少的线程,不是吗?还是 GF104 因为 SM 的数量在成本上更小?

这些结果的原因可能是什么?

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com