- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是一名数学家,使用 CUDA 进行一些数值积分。我的理解是每个 Nvidia 流式多处理器都有 8 个 CUDA 内核。所以对我来说,每个块使用超过 8 个线程似乎没有任何好处。但是,当我运行我的代码时,通过使用每块 32 个线程而不是每块 8 个线程,我获得了巨大的性能提升。
我还注意到使用超过 12 个块有巨大的 yield (即使我的卡只有 12 个流式多处理器)。
是否有一个原因?
最佳答案
talonmies 和 chaohuang 在评论中提供了很好的信息,你应该调查一下(不知道为什么这些不是答案,但这是他们的要求)。无论如何,我将提供一个简短的部分答案来解释您可能没有考虑的事情。
假设您有 8 个控制线程和 8 个处理器。如果所有 8 个线程中的所有指令都是仅占用一个周期的片上指令,那么所有 8 个线程都将在 n
周期内完成(假设每个线程的 n
总指令数)。
现在假设每个控制线程由 n
指令组成,其中一小部分 r
是片外存储器指令,例如需要 100 个周期才能完成。这 8 个线程现在需要 [(1 - r) + 100r]n
周期才能完成。如果是 r=0.1
,这大约是前一种情况的 11 倍。
现在假设我们有 16 个线程。当第一批 8 个线程在慢速操作上被阻塞时,其他线程可以执行;片内指令可以执行,片外指令可以启动。因此,不需要 2[(1 - r) + 100r]n
循环来完成所有线程,您可能只需要比 [(1 - r) + 100r]n
多一点。本质上,因为您有一些空间可以将等待线程与其他线程重叠,所以您可以免费添加更多线程。
这就是 GPU 模型的强大之处:大规模并行以克服长延迟。做一点点的工作需要很长时间,但做更多的工作却没有更多的时间。请注意,当算术强度(与上述公式中的 r
相关)很高时,占用率 - 与您准备隐藏延迟的工作量(在线程中)相关 - 对于峰值性能并不是那么重要。您可以使用 CUDA 占用计算器来查看我针对不同场景所描述的效果。
关于CUDA:为什么每个 block 超过 8 个线程有好处?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11284783/
如果函数定义顺序不对,Jslint 将指出错误。 显然 jslint 是严格的,但我想知道将函数按顺序排列是否有任何好处。 我的意思是在调用它们之前定义它们。 最佳答案 函数定义(和 var 语句)被
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
我注意到Flask tutorial涉及到点的使用。看起来它只是用于在本地创建一个轮子,这将使服务器上的设置变得更容易,但作为一个网络开发新手,我很好奇:是否有人真的会一路将他们的网站上传到像 PyP
我一直在阅读有关 jquery live event 的内容,但仍然有点困惑?使用它有什么好处? http://docs.jquery.com/Events/live 我知道它与绑定(bind)类似,
这是我的故事:我已将我的应用迁移到 AndroidX,因为我需要从网上找到的库中获取一些新功能。 问题:我目前遇到了一些问题,因为我现在需要为 Cordova 开发一个插件来实现该应用程序的一部分。
在使用 RAD 或一般不使用单元测试时使用依赖注入(inject)是否有任何好处? 最佳答案 是的,有以下几个好处: 减少依赖 减少依赖携带 更多可重用代码 更多可测试代码 更具可读性的代码 更多引用
我目前正在构建一个通过 MSI Windows Installer 分发的产品。我们的客户正在使用不同的形式(例如我们在他们自己的 MSI 中)集成该产品,使用 Bootstrap /链接器(如 Wi
有人声称 Scala 的类型系统是图灵完备的。我的问题是: 这有正式的证据吗? 简单的计算在 Scala 类型系统中会是什么样子? 这对 Scala 这种语言有什么好处吗?与没有图灵完备类型系统的语言
我开始尝试使用 React,我注意到我正在制作的简单应用程序全部使用 JS。我的 html 页面只是一个空的 body 标签! 所以我有几个问题,因为我是这个框架的新手。 我的整个应用程序应该基本上都
我们有一个相当大的基于 Windows 的 1.1 .NET 应用程序,我们正在考虑升级到 2.0。我们考虑更新的主要原因是我们可以利用 Visual Studio 2008 进行项目的持续开发,以及
我有一个页面,其中内置了基于 ajax 的分页。分页用于页面中的“评论”功能。根据 Google 的网站管理员博客,具有 rel="next"和 rel="prev"值有利于 SEO。 我在头部添加了
我是一名优秀的程序员,十分优秀!