- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在寻找 CUDA 设备的 epsilon(两个数字之间的最小步长)、min(最小幅度)和 max(最大幅度)的值。
I.E 相当于 <float.h>
中定义的 FLT_EPSILON (DBL_EPSILON)、FLT_MIN (DBL_MIN) 和 FLT_MAX (DBL_MAX)在 gcc 编译器中。
某些 CUDA 包含文件中是否有常量?
任何手册解释它们?有没有办法编写内核来计算它们?
提前致谢。
最佳答案
是的,如果您愿意,您当然可以自己计算这些。 couple examples关于如何计算机器 epsilon 在维基百科页面上以 C 语言给出;同样,您可以通过除以/乘以 2 直到下/溢出来找到最小值/最大值。 (然后您应该在最后一个有效值和下一个因子 2 之间搜索以找到“真实”的最小/最大值,但这为您提供了一个很好的起点)。
但是,如果您的设备的计算能力为 2.0 或更高,那么数学主要是 IEEE 754,有一些小偏差(例如,并非支持所有舍入模式),但这些偏差不足以影响像这样的基本数值常数;所以你会得到 5.96e-08 的单曲和 1.11e-16 的双曲的标准 emach; FLT_MIN/MAX 为 1.175494351e-38/3.402823466e+38,DBL_MIN/MAX 为 2.2250738585072014e-308/1.7976931348623158e+308。
在计算能力 1.3 的机器上,单精度不支持非规范化数字,因此您的 FLT_MIN 将明显大于 CPU。
在计算能力 2.0 机器上进行快速测试,对最小值/最大值进行快速而肮脏的计算:
#include <stdio.h>
#include <stdlib.h>
#include <getopt.h>
#include <cuda.h>
#include <sys/time.h>
#include <math.h>
#include <assert.h>
#include <float.h>
#define CHK_CUDA(e) {if (e != cudaSuccess) {fprintf(stderr,"Error: %s\n", cudaGetErrorString(e)); exit(-1);}}
/* from wikipedia page, for machine epsilon calculation */
/* assumes mantissa in final bits */
__device__ double machine_eps_dbl() {
typedef union {
long long i64;
double d64;
} dbl_64;
dbl_64 s;
s.d64 = 1.;
s.i64++;
return (s.d64 - 1.);
}
__device__ float machine_eps_flt() {
typedef union {
int i32;
float f32;
} flt_32;
flt_32 s;
s.f32 = 1.;
s.i32++;
return (s.f32 - 1.);
}
#define EPS 0
#define MIN 1
#define MAX 2
__global__ void calc_consts(float *fvals, double *dvals) {
int i = threadIdx.x + blockIdx.x*blockDim.x;
if (i==0) {
fvals[EPS] = machine_eps_flt();
dvals[EPS]= machine_eps_dbl();
float xf, oldxf;
double xd, oldxd;
xf = 2.; oldxf = 1.;
xd = 2.; oldxd = 1.;
/* double until overflow */
/* Note that real fmax is somewhere between xf and oldxf */
while (!isinf(xf)) {
oldxf *= 2.;
xf *= 2.;
}
while (!isinf(xd)) {
oldxd *= 2.;
xd *= 2.;
}
dvals[MAX] = oldxd;
fvals[MAX] = oldxf;
/* half until overflow */
/* Note that real fmin is somewhere between xf and oldxf */
xf = 1.; oldxf = 2.;
xd = 1.; oldxd = 2.;
while (xf != 0.) {
oldxf /= 2.;
xf /= 2.;
}
while (xd != 0.) {
oldxd /= 2.;
xd /= 2.;
}
dvals[MIN] = oldxd;
fvals[MIN] = oldxf;
}
return;
}
int main(int argc, char **argv) {
float fvals[3];
double dvals[3];
float *fvals_d;
double *dvals_d;
CHK_CUDA( cudaMalloc(&fvals_d, 3*sizeof(float)) );
CHK_CUDA( cudaMalloc(&dvals_d, 3*sizeof(double)) );
calc_consts<<<1,32>>>(fvals_d, dvals_d);
CHK_CUDA( cudaMemcpy(fvals, fvals_d, 3*sizeof(float), cudaMemcpyDeviceToHost) );
CHK_CUDA( cudaMemcpy(dvals, dvals_d, 3*sizeof(double), cudaMemcpyDeviceToHost) );
CHK_CUDA( cudaFree(fvals_d) );
CHK_CUDA( cudaFree(dvals_d) );
printf("Single machine epsilon:\n");
printf("CUDA = %g, CPU = %g\n", fvals[EPS], FLT_EPSILON);
printf("Single min value (CUDA - approx):\n");
printf("CUDA = %g, CPU = %g\n", fvals[MIN], FLT_MIN);
printf("Single max value (CUDA - approx):\n");
printf("CUDA = %g, CPU = %g\n", fvals[MAX], FLT_MAX);
printf("\nDouble machine epsilon:\n");
printf("CUDA = %lg, CPU = %lg\n", dvals[EPS], DBL_EPSILON);
printf("Double min value (CUDA - approx):\n");
printf("CUDA = %lg, CPU = %lg\n", dvals[MIN], DBL_MIN);
printf("Double max value (CUDA - approx):\n");
printf("CUDA = %lg, CPU = %lg\n", dvals[MAX], DBL_MAX);
return 0;
}
$ nvcc -o foo foo.cu -arch=sm_20
$ ./foo
Single machine epsilon:
CUDA = 1.19209e-07, CPU = 1.19209e-07
Single min value (CUDA - approx):
CUDA = 1.4013e-45, CPU = 1.17549e-38
Single max value (CUDA - approx):
CUDA = 1.70141e+38, CPU = 3.40282e+38
Double machine epsilon:
CUDA = 2.22045e-16, CPU = 2.22045e-16
Double min value (CUDA - approx):
CUDA = 4.94066e-324, CPU = 2.22507e-308
Double max value (CUDA - approx):
CUDA = 8.98847e+307, CPU = 1.79769e+308
关于cuda - 如何找到 CUDA 的 epsilon、min 和 max 常量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8812422/
我正在尝试模拟 Max-Min 和 Min-Min 调度算法,并在模拟中自己编写代码。但是不太了解如何在代码中实现它们的工作方式。 例如,在 FCFS 算法中我使用了 3 个服务器 (vms),每个服
有人可以帮我实现这个功能吗?此功能位于相机应用程序内部,该应用程序使用过滤算法来检测颜色变化等方面的差异。语法对我来说非常困难。我不知道如何处理参数中的指针、最小和最大变量语法、什么是增量等?有人可以
我遇到如图所示的表数据情况,我想从每个唯一成员中选择 min(code) 和 secondary_min(code) 。 即期望的输出看起来像 member | min(code) | s
我有一个查询,选择每小时的最小值: SELECT MIN(price), HOUR(timestamp), DATE(timestamp) FROM `scan` GROUP BY DATE(time
#include int min(int pArray[], int nrOfArrayElements) { min = pArray[0]; for (int i = 1; i
generate(vec.begin(), vec.end(), [=](){return static_cast(static_cast(ran()) /RAND_MAX*(max-min)+min
当 min 已经被定义为宏时,如何调用 std::min? 最佳答案 (std::min)(x,y) min 周围的括号防止宏扩展。这适用于所有函数宏。 关于c++ - 当 min 被定义为宏时如何调
我正在尝试对(几个)SQL 数据库中的现有数据负载进行一些转换分析。 数据结构本身非常简单。它只是一个 Actor 列表(比如 user_id)和他们所做的事情的名称。它看起来像这样(还有其他数据,但
我正在尝试根据浏览器的最小高度和最小宽度更改我页面上的 CSS,所以我正在使用它: @media (min-height: 500px), (min-width: 580px) { /* CSS
我有两张 table 。第一个表显示 id_product 和 Product_price_value。下面我将向您展示一个示例(在我的数据库中有很多行) 表:主产品 ID_product: prod
我有两个表:商品和价格(一对多) 每个项目都有一个默认价格,但是这个价格可以在第二个表中被覆盖(在某些情况下)。 首先,我在获取所有项目并预先计算最低价格 - 默认价格与其覆盖当前价格(如果有的话?)
我使用以下命令用 pandas 读取了此 Excel 工作表(仅“DATEHEUREMAX”列): xdata = read_excel('Data.xlsx', 'Data', usecols=['
我想了解min-max堆删除的过程是如何工作的,我已经搜索了它的伪代码但一无所获,而且我似乎不能在这里询问伪代码。所以这是我的问题 谁能展示“删除最小元素 7”的逻辑,至少让我知道伪代码“感觉如何”?
将 std::min 传递给函数不会编译。我将 std::min 的 libcpp 声明复制到我的源文件中并且它有效。 std 版本有什么问题? clang 和 gcc 也是如此。在 Godbolt
请看这个例子:http://jsfiddle.net/vrgT3/5/ 我用 overflow: auto; 创建了一个 250x250px 父 div,因此当内容溢出框时会出现滚动条。我设置了蓝色背
假设我有 4 个变量 a、b、x、y和一个约束 min(a,b) > min(x,y)。 我如何在 pulp python 中表示这个程序? 最佳答案 好的。所以,我发布(删除)的第一个答案有点仓促,
我刚刚经历了 THIS fiddle 和代码如下所示: 现在,当我使用 View 框并将值更改为 viewbox="100 100 225 225" 时它具有执行以下操作的效果
我有 minSdkVersion 16,我想搜索正确的支持库以便使用方法 setActionBar()(在 api 级别 21 中引入)。 我应该使用哪个 appcompat 版本?当然,我不想使用旧
bootstrap.min.css 和 bootstrap.min.js 有什么区别?为什么需要包含 bootstrap.min.js? 和 最佳答案 它们都是完整 Bootstrap 样式 (C
我是一名优秀的程序员,十分优秀!