- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我要向那些(几乎)不了解 GPU 工作原理的人做一个演示。我认为说 GPU 有一千个核心而 CPU 只有四到八个核心是没有意义的。但我想给我的观众一种比较的元素。
在使用 NVidia 的 Kepler 和 AMD 的 GCN 架构几个月后,我很想将 GPU“核心”与 CPU 的 SIMD ALU 进行比较(我不这样做)不知道英特尔是否有这个名称)。 公平吗?毕竟,从汇编层面来看,这些编程模型有很多共同点(至少对于 GCN,看看p2-6) ISA manual)。
This article声明 Haswell 处理器每个周期可以执行 32 个单精度运算,但我认为需要通过管道或其他方式来实现该速率。 用 NVidia 的话说,该处理器有多少个 Cuda 核心?对于 32 位操作,我会说每个 CPU 核心有 8 个,但这只是基于以下的猜测: SIMD 宽度。
当然,在比较 CPU 和 GPU 硬件时还有很多其他因素需要考虑,但这不是我想要做的。我只需要解释一下它是如何工作的。
PS:非常感谢所有指向 CPU 硬件文档或 CPU/GPU 演示文稿的指针!
编辑:感谢您的回答,遗憾的是我只能选择其中之一。我标记了Igor's answer因为它最贴近我最初的问题,并给了我足够的信息来证明为什么这种比较不应该太过分,但是 CaptainObvious provided very good articles .
最佳答案
我在进行这种比较时会非常谨慎。毕竟,即使在 GPU 世界中,“核心”一词根据上下文也具有真正不同的功能:新的 AMD GCN 与旧的 VLIW4 完全不同,而旧的 VLIW4 本身又与 CUDA 核心完全不同。
除此之外,如果你只是与CPU做一个小小的比较,你会给观众带来更多的困惑而不是理解,仅此而已。如果我是你,我仍然会进行更详细(仍然可以很快)的比较。
例如,有人习惯了CPU,但对GPU知之甚少,可能会想知道为什么GPU这么贵(在CPU世界中)却可以有这么多寄存器。对此问题的解释在本文 post 的末尾给出。以及更多 GPU 与 CPU 的比较。
这个其他article通过解释 GPU 的工作原理以及它们的演变过程并展示与 CPU 的差异,对这两种处理单元进行了很好的比较。它讨论了数据流、内存层次结构等主题,还讨论了 GPU 对于哪些类型的应用程序有用。毕竟,GPU 可以开发的所有功能只能针对某些类型的问题才能(有效)使用。
就我个人而言,如果我必须做一个关于 GPU 的演示并且可以仅提及 CPU,那么我会这样:展示 GPU 可以有效解决的问题与 CPU 可以更好处理的问题。
作为奖励,尽管它与您的演示没有直接关系,但这里是 article这让 GPGPU 得到了正确的看待,表明一些人声称的加速被高估了(顺便说一句,这与我的最后一点有关:))
关于cuda - 将 SSE/AVX 单元与 GPU 核心进行比较公平吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17426846/
Linux 有许多跨(假设是 2 个)CPU 内核执行的线程和进程。我希望我的单线程 C/C++ 应用程序成为 CPU0 上的唯一线程。我如何“移动”所有其他线程以使用 CPU1? 我知道我可以使用
我有一个类似于下图的数据库表 Table with 2 columns (UserId and value) 我将传递 UserId 和 2 个字符串。例如:userId: 1, key1: h1,
我想在我的新项目中使用 ASP.NET Core,因为我听说它更快。但是,该项目将使用广泛的数据库访问功能,Entity Framework Core 不支持其中一些功能。我想知道,是否可以使用 En
我已经使用 EntityFrameworkCore.SqlServer 2.0 开发了 asp .net core wep api 2.0 应用程序。它是使用数据库优先方法开发的。当尝试使用 dbco
我已经阅读了很多关于这个主题的文章,但我仍然无法处理这个问题。对不起,如果它是重复的,无论如何! 所以基本上,我正在从头开始构建一个 Angular 应用程序,并且我想按照最佳约定来组织我的代码。我有
我对MPI还是陌生的,所以如果这是一个琐碎的问题,请原谅我。我有一个四核CPU。我想运行一个在单个内核上使用两个进程的OpenMPI C++程序。有什么办法吗?如果是这样,那又如何?我提到了this
下面是一个传播异常处理机制的类问题,所需的输出是异常。任何人都可以解释为什么输出是异常,在此先感谢。 Class Question { public void m1() throws Excep
我想打印每个获得 CPU 时间片的进程的 name 和 pid。可能吗? 最佳答案 对于单个流程,您可以在以下位置获取此信息: /proc//stat 第14和第15个字段分别代表在用户态和内核态花费
我想知道是否可以识别具有特定 thread-id 的线程使用的物理处理器(核心)? 例如,我有一个多线程应用程序,它有两 (2) 个线程(例如,thread-id = 10 和 thread-id =
我有一个需要身份验证的 Solr 核心。假设我有一个用户,密码为password。当我现在尝试在控制台中创建一个 Solr 核心时 bin\solr create -c test 我收到 HTTP 错
我想为与使用它的项目不同的类库中的第二个和后续数据库创建迁移。有皱纹。我永远不会知道连接字符串,直到用户登录并且我可以从目录数据库 (saas) 中获取它。 对于目录数据库,我使用了来自 this 的
我想为一种可以产生 GHC Core 的简单语言创建一个前端。然后我想获取这个输出并通过正常的 GHC 管道运行它。根据this page , 不能直接通过 ghc 命令实现。我想知道是否有任何方法可
阅读文档,我构建了 2 个使用 BLE 连接 2 个 iDevices 的应用程序。 一个设备是中央设备,另一个是外围设备。 Central在寻找Peripheral,当找到它时,探索它的服务和特性,
在我的网络应用程序中,我对长时间运行的任务进行了操作,我想在后台调用此任务。因此,根据文档 .net core 3.1 Queued background tasks我为此使用这样的代码: publi
Solr 1.4 Enterprise Search Server 建议对核心副本进行大量更新,然后将其换成主核心。我正在按照以下步骤操作: 创建准备核心:http://localhost:8983/
它们是否存在,如果存在,文档和代码在哪里? 最佳答案 它们位于 Git 的 test 目录中。 https://github.com/jquery/jquery/tree/master/test 关于
我有一个 Lisp (SBCL 1.0.40.0.debian) 应用程序 (myfitnessdata),它使用以下代码来处理命令行参数: (:use :common-lisp) (:export
Core是GHC的中间语言。阅读Core可以帮助你更好地了解程序的性能。有人向我索要有关阅读 Core 的文档或教程,但我找不到太多。 有哪些文档可用于阅读 GHC Core? 这是我迄今为止发现的内
我有一个核心 WebJob 部署到 Azure Web 应用程序中。我正在使用WebJobs version 3.0.6 . 我注意到,WebJob 代码不会立即拾取对连接字符串和应用程序设置的更改(
我有一个在内部构造和使用 SqlConnection 类的第三方库。我可以从该类继承,但它有大量重载,到目前为止我一直无法找到合适的重载。我想要的是将参数附加到正在使用的连接字符串。 有没有办法在 .
我是一名优秀的程序员,十分优秀!