opengl - 是否有 acos() 函数的精确近似值？-6ren

opengl - 是否有 acos() 函数的精确近似值？

转载作者：行者123 更新时间：2023-12-04 15:21:38

25

4

我需要一个 acos()在计算着色器中使用 double 函数。由于acos()没有内置函数在具有 double 的 GLSL 中，我尝试实现我自己的。

起初，我实现了一个泰勒级数，就像 Wiki - Taylor series 中的方程一样。与预先计算的教师值(value)。但这似乎在 1 左右不准确。最大误差约为 0.08，迭代 40 次。

我也实现了 this method它在 CPU 上运行良好，最大误差为 -2.22045e-16，但我在着色器中实现它时遇到了一些麻烦。

目前，我正在使用 acos()来自 here 的近似函数有人在 this 上发布了他的近似函数地点。我正在使用本网站最准确的功能，现在我得到的最大误差为 -7.60454e-08，但该误差也太高了。

我的这个函数的代码是:

double myACOS(double x)
{
    double part[4];
    part[0] = 32768.0/2835.0*sqrt(2.0-sqrt(2.0+sqrt(2.0+sqrt(2.0+2.0*x))));
    part[1] = 256.0/135.0*sqrt(2.0-sqrt(2.0+sqrt(2.0+2.0*x)));
    part[2] = 8.0/135.0*sqrt(2.0-sqrt(2.0+2.0*x));
    part[3] = 1.0/2835.0*sqrt(2.0-2.0*x);
    return (part[0]-part[1]+part[2]-part[3]);
}

有谁知道 acos()的另一种实现方法吗？这是非常准确的 - 如果可能 - 易于在着色器中实现？

一些系统信息:

英伟达 GT 555M

使用 optirun 运行 OpenGL 4.3

最佳答案

NVIDIA GT 555M GPU 是具有计算能力 2.1 的设备，因此对基本 double 运算有 native 硬件支持，包括 fused multipy-add (FMA)。与所有 NVIDIA GPU 一样，平方根运算是模拟的。我熟悉 CUDA，但不熟悉 GLSL。根据 GLSL specification 的 4.3 版，它将 double FMA 作为函数公开 fma()并提供 double 平方根，sqrt() .不清楚 sqrt()实现根据 IEEE-754 正确四舍五入规则。我会假设它是，与 CUDA 类比。

与其使用泰勒级数，不如使用多项式 minimax approximation ，从而减少所需的术语数量。极小极大近似通常使用 Remez algorithm 的变体生成.为了优化速度和精度，使用 FMA 是必不可少的。使用 Horner scheme 评估多项式有利于高精度。在下面的代码中，使用了二阶霍纳方案。如 DanceIgel 的 answer , acos使用 asin 方便地计算近似作为与标准数学恒等式相结合的基本构建块。

使用 400M 测试向量，以下代码看到的最大相对误差为 2.67e-16，而最大值 ulp观察到的错误是 1.442 ulp。

/* compute arcsin (a) for a in [-9/16, 9/16] */
double asin_core (double a)
{
    double q, r, s, t;

    s = a * a;
    q = s * s;
    r =             5.5579749017470502e-2;
    t =            -6.2027913464120114e-2;
    r = fma (r, q,  5.4224464349245036e-2);
    t = fma (t, q, -1.1326992890324464e-2);
    r = fma (r, q,  1.5268872539397656e-2);
    t = fma (t, q,  1.0493798473372081e-2);
    r = fma (r, q,  1.4106045900607047e-2);
    t = fma (t, q,  1.7339776384962050e-2);
    r = fma (r, q,  2.2372961589651054e-2);
    t = fma (t, q,  3.0381912707941005e-2);
    r = fma (r, q,  4.4642857881094775e-2);
    t = fma (t, q,  7.4999999991367292e-2);
    r = fma (r, s, t);
    r = fma (r, s,  1.6666666666670193e-1);
    t = a * s;
    r = fma (r, t, a);

    return r;
}

/* Compute arccosine (a), maximum error observed: 1.4316 ulp
   Double-precision factorization of π courtesy of Tor Myklebust
*/
double my_acos (double a)
{
    double r;

    r = (a > 0.0) ? -a : a; // avoid modifying the "sign" of NaNs
    if (r > -0.5625) {
        /* arccos(x) = pi/2 - arcsin(x) */
        r = fma (9.3282184640716537e-1, 1.6839188885261840e+0, asin_core (r));
    } else {
        /* arccos(x) = 2 * arcsin (sqrt ((1-x) / 2)) */
        r = 2.0 * asin_core (sqrt (fma (0.5, r, 0.5)));
    }
    if (!(a > 0.0) && (a >= -1.0)) { // avoid modifying the "sign" of NaNs
        /* arccos (-x) = pi - arccos(x) */
        r = fma (1.8656436928143307e+0, 1.6839188885261840e+0, -r);
    }
    return r;
}

关于opengl - 是否有 acos() 函数的精确近似值？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28969184/

25

4

0

文章推荐： vagrant - 在 Vagrantfile 中指定 --no-parallel 标志

文章推荐： ocaml - 用于简单 OCaml 项目的基本 Oasis 或 Opam 文件

文章推荐： f# - 具有可选属性的 JSON 类型提供程序的数据示例

r - 转换错误 - .subset2(x, i, 精确 = 精确) 中的错误
感觉我在这里遗漏了一些明显的东西，所以提前道歉。无论如何，这是我尝试转换的一些数据a: acct_num year_prem prem exc 001 20
c# - 精确/文字单词或模式匹配正则表达式
我正在尝试将表中的模式与用户话语匹配。 string userUtterance = "I want identification number for number of customers";
linux - gccgo 精确
当尝试在 Precise 上链接 gccgo 时，出现此链接错误: matt@matt-1005P:~/src/gopath/src/meme$ gccgo cmd/meme/main.go -o m
matlab - 样条插值及其(精确)导数
假设我有以下数据和命令: clc;clear; t = [0:0.1:1]; t_new = [0:0.01:1]; y = [1,2,1,3,2,2,4,5,6,1,0]; p = interp1(
matlab - 样条插值及其(精确)导数
假设我有以下数据和命令: clc;clear; t = [0:0.1:1]; t_new = [0:0.01:1]; y = [1,2,1,3,2,2,4,5,6,1,0]; p = interp1(
java - 精确 PrefixQuery 得分更高
我总是想给精确匹配比只匹配前缀的分数更高的分数(例如，“ball”在与“ball*”匹配时应该比“ballistic”得到更高的分数)。我当前(详细)的方法是在创建 PrefixQuery 时始终执
Android MediaPlayer seekTo 精确
有什么解决方法可以让我在 Android 中使用 long 或 double 来寻找音频文件中的位置吗？目前 seekTo 只接受 ints 参数。我想更精确(比如在十分之一秒内) int resID
Swift 3 replacingOccurrences 精确
我的 replacingOccurrences 函数有问题。我有一个这样的字符串: let x = "john, johnny, johnney" 我需要做的只是删除“john” 所以我有这段代码:
python - 精确标签值时出错 - BeautifulSoup
我正在使用 BeautifulSoup 进行网页抓取。我有这段代码来提取 a 标签的值，但它似乎不起作用。显示错误: AttributeError: 'int' object has no attri
algorithm - 精确(纠错)图匹配算法
我要在带有标记顶点和标记有向边的图上寻找一种不精确的图匹配算法。我的任务是检测两个图表的变化以将它们显示给开发人员(想想颠覆差异)。我已经实现了基于禁忌搜索 ( this ) 的优化算法，但我无法让该
apache - .htaccess 精确 url 重定向
我有两个网站: example.com 和 yyy.com 他们都有类似的网络应用程序，但在不同的服务器上。我想让 Apache 将所有路径请求重定向到 example.com 与完全相同的方式yy
php - MySQL 精确 URL 搜索
因此，我尝试合并两个公司信息数据库(从现在起表 A 和表 B)，其中最常见(且可靠)的单一引用点是网站 URL。表 A 已更新，表 B 待更新。我已经从表 A 中提取了 URL，并使用 PHP 清理
javascript - 为什么距离的这种指数衰减会导致 99 [精确] 的一次性误差？
我正在 http://classicorthodoxbible.com/new.html 上制作效果主要描述中的 Angular 色，包裹在自己的跨度中，从他们通常的休息地点移动到随机位置，然后通过指
用于实时音频合成的 C++ 精确 44100Hz 时钟
我目前正在使用我的 Raspberry Pi 及其内置 UART 输入编写 MIDI 合成器。在某个时间点，为了启用 MIDI 输入的实时回放，我必须设置一种环形缓冲区以与 OpenAL 一起使用，
c - 使 C float 精确？
在 C 中，当设置了一个 float 时， int main(int argc, char *argv[]) { float temp = 98.6f; printf("%f\n",
ios - 循环 MP3 精确 iOS
实现 MP3 无间隙循环的最佳可能性是什么？目前我正在使用 AVAudioPlayer 并将 .numberOfLoops() 属性设置为 -1 但可以听到，轨道重新启动。情况并非如此，例如使用 Tr
r - "matrix-like?"的(精确)含义是什么
我想创建不一定是“正确”矩阵的“类矩阵”对象。但是，确切地说，“类矩阵”是什么意思？示例 1 > image(1:9) Error in image.default(1:9) : argument
java - 如何生成包含已解析实体的 XML 文档的*精确*副本
给定一个像这样的 XML 文档: john &title; 我想解析上面的 XML 文档并生成其所有实体已解析的副本。因此，给定上述 XMl 文档，解析器应输出: john
plone - 有一种方法可以在 Plone 中*精确*即时调整图像对象的大小吗？
需要说明的是，这种方法不是我要找的: 事实上，此方法会调整 ImageField 的大小。我想将 Image 对象的大小调整为特定且精确的无比例分辨率。有什么办法吗？ --编辑-- 对我来说，Ima
python - 急切模式下的 TFP 精确 GP 回归
我正在尝试使用 TF2.0 eager 模式执行精确的 GP 回归，基于来自 https://colab.research.google.com/github/tensorflow/probabili

首页

博学

6Ren·AI

商城

opengl - 是否有 acos() 函数的精确近似值？