opengl - 如何为 GPGPU 扩展顶点着色器功能-6ren

opengl - 如何为 GPGPU 扩展顶点着色器功能

转载作者：行者123 更新时间：2023-12-05 06:45:19

25

4

我正在尝试在 GLSL 上实现 Scrypt 哈希器(用于 LTC 矿工)(不要问我为什么)。

而且，实际上，我坚持使用 HMAC SHA-256 算法。尽管我已经正确实现了 SHA-256(它为输入重新调整了正确的散列)，但当我添加最后一步(散列与 oKey 连接的先前散列)时，片段着色器停止编译。

着色器不能执行超过三轮的 SHA-256。它只是停止编译。限制是什么？它不使用太多内存，总共 174 个 vec2 对象。看起来，它与内存无关，因为任何额外的 SHA256 轮次都不需要新的内存。看起来，它与视口(viewport)大小无关。它停止在 1x1 和 1x128 视口(viewport)上工作。

我已经开始在 WebGL 上做矿工，但在限制出现后，我试图在全功能 OpenGL 上的 Qt 中运行相同的着色器。结果，桌面 OpenGL 允许比 WebGL 中的 OpenGL ES 少一轮 SHA256(为什么？)。

忘了说。着色器在链接阶段失败。着色器本身编译良好，但程序链接失败。

我不使用任何纹理、任何扩展、缓慢的东西等。只是简单的正方形(4 个 vec2 vertecies)和片段着色器的几个制服。输入数据只有 80 个字节，片段着色器的结果是二进制的(黑色或白色)，因此该任务非常符合 GLSL 原则。

我的视频卡是 Radeon HD7970，具有大量 VRAM，能够容纳数百个 scrypt 线程(scrypt 每个哈希使用 128kB，但我不能仅实现 HMAC-SHA-256)。我的卡支持 OpenGL 4.4。

我是 OpenGL 的新手，可能理解有误。我知道片段着色器分别为每个像素运行，但如果我有 1x128 视口(viewport)，则只使用 128x348 字节。片段着色器的限制在哪里。

这是我用来让您了解我如何尝试解决问题的常用代码。

uniform vec2 base_nonce[2];
uniform vec2 header[20];    /* Header of the block */
uniform vec2 H[8];
uniform vec2 K[64];

void sha256_round(inout vec2 w[64], inout vec2 t[8], inout vec2 hash[8]) {
    for (int i = 0; i < 64; i++) {
        if( i > 15 ) {
            w[i] = blend(w[i-16], w[i-15], w[i-7], w[i-2]);
        }

        _s0 = e0(t[0]);
        _maj = maj(t[0],t[1],t[2]);
        _t2 = safe_add(_s0, _maj);
        _s1 = e1(t[4]);
        _ch = ch(t[4], t[5], t[6]);
        _t1 = safe_add(safe_add(safe_add(safe_add(t[7], _s1), _ch), K[i]), w[i]);

        t[7] = t[6]; t[6] = t[5]; t[5] = t[4];
        t[4] = safe_add(t[3], _t1);
        t[3] = t[2]; t[2] = t[1]; t[1] = t[0];
        t[0] = safe_add(_t1, _t2);
    }
    for (int i = 0; i < 8; i++) {
        hash[i] = safe_add(t[i], hash[i]);
        t[i] = hash[i];
    }
}

void main () {
    vec2 key_hash[8]; /* Our SHA-256 hash */
    vec2 i_key[16];
    vec2 i_key_hash[8];
    vec2 o_key[16];

    vec2 nonced_header[20]; /* Header with nonce */
    set_nonce_to_header(nonced_header);

    vec2 P[32]; /* Padded SHA-256 message */
    pad_the_header(P, nonced_header);

    /* Hash HMAC secret key */
    sha256(P, key_hash);

    /* Make iKey and oKey */
    for(int i = 0; i < 16; i++) {
        if (i < 8) {
            i_key[i] = xor(key_hash[i], vec2(Ox3636, Ox3636));
            o_key[i] = xor(key_hash[i], vec2(Ox5c5c, Ox5c5c));
        } else {
            i_key[i] = vec2(Ox3636, Ox3636);
            o_key[i] = vec2(Ox5c5c, Ox5c5c);
        }
    }

    /* SHA256 hash of iKey */

    for (int i = 0; i < 8; i++) {
        i_key_hash[i] = H[i];
        t[i] = i_key_hash[i];
    }

    for (int i = 0; i < 16; i++) { w[i] = i_key[i]; }
    sha256_round(w, t, i_key_hash);

    gl_FragColor = toRGBA(i_key_hash[0]);
}

我可以使用哪些解决方案来改善这种情况？在 OpenGL ES 3.1 中，OpenGL 4.4 中有什么很酷的东西吗？甚至有可能进行这样的计算并在片段着色器中保留这么多(128kB)吗？顶点着色器的限制是什么？我可以在顶点着色器而不是片段上做同样的事情吗？

最佳答案

我试着回答我自己的问题。

着色器是一个小型处理器，具有有限的寄存器和缓存内存。此外，指令执行也有限制。因此，将所有内容都装入一个片段着色器的整个架构是错误的。

换句话说，您可以在渲染期间更改着色器程序数十或数百次。这是正常做法。

有必要将大的计算分成更小的部分并分别渲染。使用渲染到纹理保存您的工作。

由于 webgl statistic ，96.5% 的客户端有 MAX_TEXTURE_SIZE eq 4096。它给你 32 兆字节的内存。可以包含256个scrypt计算线程的草稿数据。

关于opengl - 如何为 GPGPU 扩展顶点着色器功能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25044582/

25

4

0

文章推荐： javascript - html2canvas 等待图片加载

文章推荐： git - 如何在 fedora 20 中为 git-svn 禁用 pinentry-qt？

文章推荐： javascript - 如何随机遍历数组一次，然后按顺序重复遍历

C# Dll注入(inject)器，VB.Net Dll注入(inject)器
我之前让 dll 注入(inject)器变得简单，但我有 Windows 7，我用 C# 和 C++ 做了它，它工作得很好!但是现在当我在 Windows 8 中尝试相同的代码时，它似乎没有以正确的方
javascript - Polymer 1.0 尝试制作一种类似于核心 split 器的 split 器，可以称为铁 split 器
我正在尝试制作一个名为 core-splitter 的元素，该元素在 1.0 中已弃用，因为它在我们的项目中起着关键作用。如果您不知道 core-splitter 的作用，我可以提供一个简短的描述。
scrapy - 在scrapy的同一进程中运行多个蜘蛛后如何停止 react 器？
我有几个不同的蜘蛛，想一次运行所有它们。基于 this和 this ，我可以在同一个进程中运行多个蜘蛛。但是，我不知道如何设计一个信号系统来在所有蜘蛛都完成后停止 react 器。我试过了: cra
twisted - 在某个条件下停止扭曲 react 器
有没有办法在达到特定条件时停止扭曲 react 器。例如，如果一个变量被设置为某个值，那么 react 器应该停止吗？最佳答案理想情况下，您不会将变量设置为一个值并停止 react 器，而是调用
javascript - 我如何定义我的应用程序的注入(inject)器
https://code.angularjs.org/1.0.0rc9/angular-1.0.0rc9.js 上面的链接定义了外部js文件，我不知道Angular-1.0.0rc9.js的注入(in
angularjs - 如何为我的应用程序检索注入(inject)器？
我正在尝试运行一个函数并将服务注入(inject)其中。我认为这可以使用 $injector 轻松完成.所以我尝试了以下(简化示例): angular.injector().invoke( [ "$q
gwt - 使用多个抽象模块实例化一个注入(inject)器
在 google Guice 中，我可以使用函数 createInjector 创建基于多个模块的注入(inject)器。因为我使用 GWT.create 在 GoogleGin 中实例化注入(in
c# - 属性的自定义配置绑定(bind)器
我在 ASP.NET Core 1.1 解决方案中使用配置绑定(bind)。基本上，我在“ConfigureServices Startup”部分中有一些用于绑定(bind)的简单代码，如下所示: s
java - Spring初始化绑定(bind)器
我在 Spring MVC 中设置 initBinder 时遇到一些问题。我有一个 ModelAttribute，它有一个有时会显示的字段。 public class Model { privat
jquery post表单数据和MVC模型绑定(bind)器
我正在尝试通过jquery post发布knockoutjs View 模型 var $form = $('#barcodeTemplate form'); var data = ko.toJS(vm
c# - 具有多态对象集合的复杂模型的自定义模型绑定(bind)器
如何为包含多态对象集合的复杂模型编写自定义模型绑定(bind)程序？我有下一个模型结构: public class CustomAttributeValueViewModel { publi
c# - 使用多个构造函数注册开放泛型的简单注入(inject)器
您好，我正在尝试实现我在 this article 中找到的扩展方法对于简单的注入(inject)器，因为它不支持开箱即用的特定构造函数的注册。根据这篇文章，我需要用一个假的委托(delegate)
c# - 注册动态类型的简单注入(inject)器
你好，我想自动注册我的依赖项。我现在拥有的是: public interface IRepository where T : class public interface IFolderReposi
javascript - 带有位置服务的angularjs注入(inject)器
我正在使用 Jasmine 测试一些 Angular.js 代码。为此，我需要一个 Angular 注入(inject)器: var injector = angular.injector(['ng'
C 代码 reshape 器
我正在使用 Matlab 代码生成器。不可能包含代码风格指南。这就是为什么我正在寻找一个工具来“ reshape ”、重命名和重新格式化生成的代码，根据我的: 功能横幅约定文件横幅约定命名约定等
c++ - 与模板模板类一起使用的自定义模板参数绑定(bind)器
这个问题在这里已经有了答案: Where and why do I have to put the "template" and "typename" keywords? (8 个答案) 关闭 8
c++ - 开源dll注入(inject)器
我开发了一种工具，可以更改某些程序的外观。为此，我需要在某些进程中注入(inject)一个 dll。现在我基本上使用这个 approach .问题通常是人们无法注入(inject) dll，因为他们
java - 是否有使用方面和注释的数据绑定(bind)器？
我想使用 swing、spring 和 hibernate 编写一个 java 应用程序。我想使用数据绑定(bind)器用 bean 的值填充 gui，并且我还希望它反射(reflect) gui
python - 当两个蜘蛛都完成时如何停止 react 器
我有这段代码，当两个蜘蛛完成后，程序仍在运行。 #!C:\Python27\python.exe from twisted.internet import reactor from scrapy.cr
java - 我如何才能限定我不使用的 Autowiring 器 "own"
要点是 Spring Batch (v2) 测试框架具有带有 @Autowired 注释的 JobLauncherTestUtils.setJob。我们的测试套件有多个 Job 类提供者。因为这个类不

首页

博学

6Ren·AI

商城

opengl - 如何为 GPGPU 扩展顶点着色器功能