- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
问题:是否有适用于 Geforce 卡的模拟器,可以让我在没有实际硬件的情况下编程和测试 CUDA?
<小时/>信息:
我希望加快 CUDA 中的一些模拟速度,但我的问题是我并不总是在桌面周围进行此开发。我想在我的上网本上做一些工作,但我的上网本没有 GPU。现在据我所知,您需要一个支持 CUDA 的 GPU 才能运行 CUDA。有办法解决这个问题吗?似乎唯一的方法是 GPU 模拟器(这显然会非常慢,但可以工作)。但无论有什么方法可以做到这一点,我都想听听。
我正在 Ubuntu 10.04 LTS 上编程。
最佳答案
gpuocelot
依赖关系。我尝试为 BunsenLabs 获取模拟器(Linux 3.16.0-4-686-pae #1 SMPDebian 3.16.7-ckt20-1+deb8u4 (2016-02-29) i686 GNU/Linux)。
我会告诉你我学到了什么。
<小时/>nvcc
曾经在 CUDA Toolkit 3.0 中具有 -deviceemu
选项我下载了 CUDA Toolkit 3.0,安装了它并尝试运行一个简单的程序:
#include <stdio.h>
__global__ void helloWorld() {
printf("Hello world! I am %d (Warp %d) from %d.\n",
threadIdx.x, threadIdx.x / warpSize, blockIdx.x);
}
int main() {
int blocks, threads;
scanf("%d%d", &blocks, &threads);
helloWorld<<<blocks, threads>>>();
cudaDeviceSynchronize();
return 0;
}
请注意,在 CUDA Toolkit 3.0 中,nvcc
位于 /usr/local/cuda/bin/
中。
事实证明我在编译时遇到了困难:
NOTE: device emulation mode is deprecated in this release
and will be removed in a future release.
/usr/include/i386-linux-gnu/bits/byteswap.h(47): error: identifier "__builtin_bswap32" is undefined
/usr/include/i386-linux-gnu/bits/byteswap.h(111): error: identifier "__builtin_bswap64" is undefined
/home/user/Downloads/helloworld.cu(12): error: identifier "cudaDeviceSynchronize" is undefined
3 errors detected in the compilation of "/tmp/tmpxft_000011c2_00000000-4_helloworld.cpp1.ii".
我在互联网上发现,如果我使用 gcc-4.2
或类似的古老版本而不是 gcc-4.9.2
,错误可能会消失。我放弃了。
gpuocelot
Stringer 的答案有一个非常古老的 gpuocelot
项目网站的链接。所以一开始我以为这个项目在2012年左右就被放弃了。事实上,几年后它就被废弃了。
以下是一些最新网站:
我尝试按照 the guide 安装 gpuocelot 。但我在安装过程中遇到了一些错误,我再次放弃了。 gpuocelot
不再受支持,并且依赖于一组非常特定版本的库和软件。
您可以尝试关注this tutorial从 2015 年 7 月开始,但我不保证它会起作用。我没有测试过。
The MCUDA translation framework is a linux-based tool designed to effectively compile the CUDA programming model to a CPU architecture.
这可能有用。这是a link to the website .
它是一个在 Windows 7 和 8 上使用的模拟器。不过我还没有尝试过。它似乎不再被开发(最后一次提交日期为 2013 年 7 月 4 日)。
以下是该项目网站的链接:https://code.google.com/archive/p/cuda-waste/
关于cuda - GPU 仿真器,无需硬件即可进行 CUDA 编程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3087361/
我刚刚意识到二进制编译器会将源代码转换为目标平台的二进制文件。有点明显...但如果编译器以这种方式工作,那么同一个编译器如何用于不同的系统,如 x86、ARM、MIPS 等? 难道他们不应该“知道”硬
在我的 SDL 游戏中,出于游戏玩法和性能原因,我希望保留固定的游戏区域分辨率。 我想做的是有一个小分辨率(例如 320 * 240),并且在调整窗口大小时/切换到全屏模式时让 SDL/显卡缩放每个像
我正在使用这些方法来激活 SurFaceView 上的触摸焦点 private SurfaceView surfaceiew; private CameraSource camSource; priv
您好,当我从硬件菜单更改设备时,我遇到了这个奇怪的问题,但我想我可能遗漏了一些简单的东西。 我的 View Controller 中有这段代码: - (void)touchesBegan:(NSSet
编写一个名为 weird() 的函数,它将三个字符串作为参数并向后打印最长的一个。 (在平局的情况下,应该选择较早的参数字符串。 函数调用: weird("I", "Love", "Python")
您好,我正在尝试设置 hadoop 环境。简而言之,我要解决的问题涉及数十亿个大小为几 MB 的 XML 文件,使用 HIVE 从中提取相关信息,并对这些信息进行一些分析工作。我知道这在 hadoop
我知道 Phidgets,但是,我正在寻找可以与 C# 接口(interface)的一些其他类型的硬件。 谁有好东西? 最佳答案 查看 Netduino .它基于 Arduino,但使用 .Net
说一个函数(例如模乘法、正弦函数)是在硬件而不是软件中实现是什么意思? 最佳答案 在硬件中实现意味着电路(通过逻辑门等)可以执行操作。 例如,在 ALU 中,处理器在物理上能够将一个字节加到另一个字节
我需要编写一个程序,在可能状态的大空间中执行并行搜索,在此过程中发现了新区域(并开始了他们的探索),并且由于在其他地方获得的中间结果消除了可能性,因此提前终止了对某些区域的探索在其中发现新的有用结果。
我们需要通过带有硬件 token 的 EV 代码对 InstallShield 2013 Express 的安装进行签名,但是无法导出私钥证书文件,因此唯一的方法是使用 DigiCertUtil 工具
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 2 年前。 Improve this ques
我考虑从库中丢弃处理大端情况的代码,如果平台不是小端,则在初始化期间简单地抛出一个异常。如果我们限制为,我无法想象会有任何大端硬件 托管任何网站的典型服务器硬件 服务器根据开放计算项目规范 所有常见的
我知道这可以做到,但找不到交换目标调试设备的地方。我现在正在使用模拟器,但想切换到设备,反之亦然。谁能指出我正确的方向? 谢谢。 最佳答案 像这样.. 右键单击 PROJECT--->Run As--
我正在尝试创建一个监听音量键事件的服务。 每当按下音量键时,服务应向号码发送短信,但我无法检测到音量键事件。 最佳答案 您可以使用 OnKeyListener可以检测按键事件(包括音量键)。您可以找到
谁能解释一下中断如何从最低层(硬件)传递到应用程序。 所以在下图中我知道处理器之后发生了什么。 但是我想要从键盘按下到处理器的中断过程在硬件中发生了什么,例如它如何传递扫描代码,中断 Controll
我的任务是构建一个应用程序,其中业务用户将定义一些数据操作和处理规则(例如,取一个数值并将其平均分配给根据中指定的条件选择的多个记录)规则)。 每月必须运行一个批处理应用程序,以便根据定义的规则处理大
所以这是我的愚蠢问题: PGP/GPGP可以用来对文本进行签名,其他的使用公钥来验证。 比方说,非对称密码算法处理空间。 有没有什么算法可以处理时间? 例如在 2011-10-10 10:10:10
使用 nvcc 编译 CUDA 程序是否需要安装支持 CUDA 的显卡(在 Linux 中)?或者可以在任何地方编译程序并且只能在这样的系统上运行? 最佳答案 不,编译不需要显卡。 您甚至不需要一个来
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
我有一个奇怪的问题,但我对这个话题很感兴趣。 是否有可能直接访问当前基于 x64 的计算机的硬件,而无需使用某种 HAL(硬件抽象层)或其他操作系统(udev、upower 等)的附属物?我不是在谈论
我是一名优秀的程序员,十分优秀!