c++ - 如何应对修改原子值-6ren

c++ - 如何应对修改原子值

转载作者：太空宇宙更新时间：2023-11-04 11:39:35

25

4

我想编写一个简单的代码，根据输入的数据 vector 进行一些计算。它应该只返回一个值。我不知道如何实现这一目标。我写了一个简单的测试来检查它是如何工作的，但我得到了一个编译错误。这是代码:

Float Subset::parallel_tests() 
{ 
float sum = 0.0f; 

concurrency::parallel_for_each(concurrency::extent<1>(121), [=, &sum] (concurrency::index<1> idx) restrict(amp) 
{ 
    sum += 0.2f; 
}); 

return sum; 
}

当我尝试编译这段代码时，出现以下错误:

错误 C3590:“sum”:如果 lambda 受放大器限制，则不支持按引用捕获或“this”捕获error C3581: 'cci::Subset::parallel_tests::': amp 限制代码中不支持的类型

最佳答案

您的代码无法编译的原因是因为 sum 是在您的类中声明的，而不是包含在 array_view 中。本质上，您正在尝试从 AMP 限制代码访问 this->sum。在将 sum 传递给 parallel_for_each 之前，您需要使用以下代码对其进行包装，然后应该使用 avSum。

int sum = 0;
array_view<int, 1> avSum(1, &sum);

您还需要使用原子操作在多个线程中增加 sum 的值，这在很大程度上否定了 GPU 提供的并行性。这不是正确的方法。

减少

我认为您要实现的是减少。您正在尝试对输入数组中的所有值求和并返回单个结果。这是 GPU 编程中一个有据可查的问题。 NVidia 已经制作了几份关于它的白皮书。 The C++ AMP Book也对此进行了详细介绍。

这是最简单的实现。它不使用平铺，效率相对较低，但易于理解。 stride 循环的每次迭代都会添加数组的连续元素，直到最终结果在元素 0 中。对于包含 8 个元素的数组:

stride = 4: a[0] += a[4]; a[1] += a[5]; a[2] += a[6]; a[3] += a[7]
stride = 2: a[0] += a[2]; a[1] += a[1];

零元素现在包含总数。

class SimpleReduction
{
public:
    int Reduce(accelerator_view& view, const std::vector<int>& source, 
        double& computeTime) const
    {
        assert(source.size() <= UINT_MAX);
        int elementCount = static_cast<int>(source.size());

        // Copy data
        array<int, 1> a(elementCount, source.cbegin(), source.cend(), view);
        std::vector<int> result(1);
        int tailResult = (elementCount % 2) ? source[elementCount - 1] : 0;
        array_view<int, 1> tailResultView(1, &tailResult);

        for (int stride = (elementCount / 2); stride > 0; stride /= 2)
        {
            parallel_for_each(view, extent<1>(stride), [=, &a] (index<1> idx)
                restrict(amp)
            {
                a[idx] += a[idx + stride];

                // If there are an odd number of elements then the 
                // first thread adds the last element.
                if ((idx[0] == 0) && (stride & 0x1) && (stride != 1))
                    tailResultView[idx] += a[stride - 1];
            });
        }

        // Only copy out the first element in the array as this 
        // contains the final answer.
        copy(a.section(0, 1), result.begin());

        tailResultView.synchronize();
        return result[0] + tailResult;
    }
};

您可以将其平铺，其中平铺中的每个线程负责为其元素生成结果，然后将所有平铺的结果相加。

template <int TileSize>
class TiledReduction 
{
public:
    int Reduce(accelerator_view& view, const std::vector<int>& source, 
        double& computeTime) const
    {
        int elementCount = static_cast<int>(source.size());

        // Copy data
        array<int, 1> arr(elementCount, source.cbegin(), source.cend(), view);

        int result;
        computeTime = TimeFunc(view, [&]() 
        {
            while (elementCount >= TileSize)
            {
                extent<1> e(elementCount);
                array<int, 1> tmpArr(elementCount / TileSize);

                parallel_for_each(view, e.tile<TileSize>(), 
                    [=, &arr, &tmpArr] (tiled_index<TileSize> tidx) restrict(amp)
                {
                    //  For each tile do the reduction on the first thread of the tile.
                    //  This isn't expected to be very efficient as all the other
                    //  threads in the tile are idle.
                    if (tidx.local[0] == 0)
                    {
                        int tid = tidx.global[0];
                        int tempResult = arr[tid];
                        for (int i = 1; i < TileSize; ++i)
                            tempResult += arr[tid + i];

                        //  Take the result from each tile and create a new array. 
                        //  This will be used in the next iteration. Use temporary 
                        // array to avoid race condition.
                        tmpArr[tidx.tile[0]] = tempResult;
                    }
                });

                elementCount /= TileSize;
                std::swap(tmpArr, arr);
            }

            //  Copy the final results from each tile to the CPU and accumulate them 
            std::vector<int> partialResult(elementCount);
            copy(arr.section(0, elementCount), partialResult.begin());
            result = std::accumulate(partialResult.cbegin(), partialResult.cend(), 0);
        });
        return result;
    }
};

这仍然不是最有效的解决方案，因为它没有良好的内存访问模式。您可以在本书的 Codeplex 站点上看到对此的进一步改进。

关于c++ - 如何应对修改原子值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21836280/

25

4

0

文章推荐： java - 如何有效地使用目标 MappedByteBuffer？

文章推荐： java - 使用 Java 解析 ALM XML 数据

文章推荐： C++ Allegro5 代码块链接器

MSSQL监控数据库的DDL操作(创建，修改，删除存储过程，创建，修改，删除表等)
前言：有时候，一个数据库有多个帐号，包括数据库管理员，开发人员，运维支撑人员等，可能有很多帐号都有比较大的权限，例如DDL操作权限(创建，修改，删除存储过程，创建，修改，删除表等），账户多了，管理
c - 下面的代码有什么问题？预期 X 由线程 Func 1 修改，随后 X 由线程 Func 2 修改
这个问题已经有答案了: Condition variable deadlock (2 个回答) 已关闭 5 年前。在研究多线程时，我编写了以下代码，但在屏幕上没有观察到输出。我在这里做错了什么？我期
修改.htaccess实现301域名重定向示例分享
复制代码代码如下: <IfModule mod_rewrite.c> RewriteEngineOn RewriteBase/ #将www.zzvips.com跳转到www.zzv
修改.htaccess实现子目录绑定示例分享
复制代码代码如下: <IfModule mod_rewrite.c> RewriteEngine On RewriteBase / # 把 www.zzvips.com
修改 Gateway和DNS的vbs脚本
复制代码代码如下: Const T_GATEWAY = "1.1.1.1" '网关 Const T_NEWDNS1 = "2.2.2.2" 'DNS1
ElasticSearch学习2 - 查询、修改
0. 修改索引大文本字段支持排序 PUT http://localhost:9200/lrc_blog/_mapping //请求体 { "properties": { "title": { "t
javascript - 修改 DOM
仅 react 当状态发生变化时重新渲染 . 那么为什么我会直接看到我对真实 DOM 所做的更改呢？我知道我正在修改真实的 DOM，但是当我根本没有改变状态时触发重新渲染的是什么。 import R
swiftui - 修改@FetchRequest
Xcode beta 5 推出 @FetchRequest对于 SwiftUI。我有一个 View ，它有一个 @FetchRequest . NSFetchRequest是在管理器中创建的，该管理
php - 修改/编译开源项目源代码的最佳方法是什么？
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 7年前关闭。 Improve this questi
PHP preg_replace 修改
我有一个表达式[text][id]应替换为链接 text 解决方案是( id 是整数) $s = preg_replace("/\[([^\]]+)(\]*)\]\[([0-9]+)\]/","$1$
svn - 如何防止文件在颠覆中被提交/修改？
我在 repo 中有一个文件，我不想让任何人更新。我能做什么？最佳答案你想要svn锁:http://www.linxit.de/svnbook/en/1.2/svn.ref.svn.c.lock
powershell - 修改/转换选择对象中的数据
说我有项目 list 。我想导出到csv，但在此之前我想做一些计算/修改。基本上，设置如下所示: PS C:\Files> gci Directory: C:\Files Mode
Java API 修改
我有一个非常简单的问题 - 是否可以修改 Java API 的源代码，例如Junit，JABX ？我知道这似乎是一个非常愚蠢的问题，但它一直困扰着我一段时间。最佳答案如果您可以掌握源代码，那么请
r - 修改/添加列到嵌套的tibble
我有一个带有变量/列的小标题，其中包括不同形状的小标题列表。我想为其中一个变量中的每个(子)标题添加一个变量/列。例如此类数据 library("tibble") aaa aaa # A tibb
Javascript url 修改
我有几个菜单，可以在单击时向当前链接添加变量。这是一个例子: 1 2 3 x y z 我的问题是，如果我选择“y”2次，它会添加“&cord=y”2次。相反，我希望它替
.net - 修改.NET服务安装程序的安装路径
我有两个项目:一个服务项目和一个服务安装程序项目。服务项目具有适合我的产品的装配信息。它包括公司信息和正确的服务名称。一旦服务实际安装，所有这些似乎都会被忽略。安装服务时，它使用在服务安装程序的ini
perl - 修改$_的时候会出错吗？
以下代码何时可能产生副作用？ @some = map { s/xxx/y/; $_ } @some; perlcritic 将其解释为危险的，因为例如: @other = map { s/xxx/y/
java - 修改.class文件
我想知道以下哪种解决方案更好:我想修改一些 .class 文件，我意识到有两种方法可以做到这一点: 反编译.class文件，修改它，最后再次编译。 - 直接用十六进制编辑器修改。谢谢最佳答案在这
java - 修改 addMouseListener()
这是我的按钮代码 onclick 我希望我的程序等待用户单击一个 JPanel，并且当用户单击 JPanel 时，它应该在控制台上打印其名称。此按钮代码未显示输出 JPopupMenu popu
java - 修改/设置从访问器方法返回的字符串
我正在使用一个具有“getName()”方法的特定 API。 getName() 返回一个字符串。是否可以修改该字符串？ API 中不包含修饰符方法，并且 String getName() 返回的是私

首页

博学

6Ren·AI

商城

c++ - 如何应对修改原子值