c - 单线程模式下并行合并非常慢-6ren

c - 单线程模式下并行合并非常慢

转载作者：行者123 更新时间：2023-11-30 17:55:29

25

4

我有两组已排序的元素，并希望以某种方式将它们合并在一起，以便稍后可以并行化它。我有一个简单的合并实现，它具有数据依赖性，因为它使用最大值函数和可并行合并的第一个版本，该版本使用二分搜索来查找排名并计算给定值的索引。

getRank 函数返回低于或等于给定needle 的元素数量。

#define ATYPE int

int getRank(ATYPE needle, ATYPE *haystack, int size) {
    int low = 0, mid;
    int high = size - 1;
    int cmp;
    ATYPE midVal;

    while (low <= high) {
        mid = ((unsigned int) (low + high)) >> 1;
        midVal = haystack[mid];
        cmp = midVal - needle;

        if (cmp < 0) {
            low = mid + 1;
        } else if (cmp > 0) {
            high = mid - 1;
        } else {
            return mid; // key found
        }
    }

    return low; // key not found
}

合并算法对两个排序集 a、b 进行操作，并将结果存储到 c 中。

void simpleMerge(ATYPE *a, int n, ATYPE *b, int m, ATYPE *c) {
    int i, l = 0, r = 0;

    for (i = 0; i < n + m; i++) {
        if (l < n && (r == m || max(a[l], b[r]) == b[r])) {
            c[i] = a[l];
            l++;
        } else {
            c[i] = b[r];
            r++;
        }
    }
}

void merge(ATYPE *a, int n, ATYPE *b, int m, ATYPE *c) {
    int i;
    for (i = 0; i < n; i++) {
        c[i + getRank(a[i], b, m)] = a[i];
    }
    for (i = 0; i < m; i++) {
        c[i + getRank(b[i], a, n)] = b[i];
    }
}

当有很多元素时，合并操作非常慢，并且仍然可以并行化，但是 simpleMerge 总是更快，即使它不能并行化。

所以我现在的问题是，你知道并行合并有什么更好的方法吗？如果是的话，你能给我指出一个方向还是我的代码太糟糕了？

最佳答案

simpleMerge 函数的复杂性:

O(n + m)

merge 函数的复杂性:

O(n*logm + m*logn)

在没有考虑太多的情况下，我对并行化的建议是找到每个函数中间的单个值，使用类似于 getRank 函数的东西，并从那里使用简单的合并。这可以是O(n + m + log m + log n) = O(n + m)(即使你做了一些但恒定数量的查找来找到中间的值) .

关于c - 单线程模式下并行合并非常慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14294773/

25

4

0

文章推荐： c - 对多线程 TCP 客户端执行 'close ()' 时未发送 TCP FIN

文章推荐： c - 失去对循环变量的依赖 - 循环优化

文章推荐： c# - 忽略部分语句

文章推荐： c - Gwan 处理程序仅接受文件请求

C++ 单线。在同一行上构造对象和调用函数是否合法
此代码似乎在启用优化的广泛使用的编译器上中断，尽管它在 Visual Studio 中运行良好。 struct foo { foo(int a) { s[0] = '0'+a%10;s[1]
javascript - 带箭头的 highcharts 单线
我想要一个图表，其中有一个单线箭头，如下所示: 1 2 3 4 5 或者像这样(其中/假设是一个箭头:)): \/ -----------------
java - 单线 Sonar 插件maven测试中的多个问题
我正在为 Java 编写自定义规则。有两个 Tree.KIND 实例(STRING_LITERAL 和 ASSIGNMENT)需要捕获。有一个特定的行，字符串文字和赋值的逻辑都会引发问题。但 Sona
ruby - FizzBuzz Ruby 单线
Rosettacode.org 在 Ruby 中有这个出色的单行 FizzBuzz 解决方案。 1.upto(100){|n|puts'FizzBuzz '[i=n**4%-15,i+13]||n
linux - 单线 FTP 服务器
很多时候我使用了这个命令，它在当前目录打开了一个临时的 HTTP 服务器: python3 -m http.server 现在我需要接收文件，有没有打开ftp服务器的一行命令？我只是在寻找一个命令行
c++ - 非指针上的 RAII 单线？
相关主题 std::unique_ptr, deleters and the Win32 API 要将 Win32 句柄用作 RAII，我可以使用以下行 std::unique_ptr::type,
java - 用于转换不可变列表的 Guava 单线
我认为必须有一个单行 Guava 解决方案来将一个不可变列表转换为另一个不可变列表，但我找不到它。假设我们有以下对象: ImmutableList input = ImmutableList.of("
javascript - Highcharts 网格线宽度(或颜色)- 单线
我有以下 Highcharts ( http://www.highcharts.com ) 散点图。请注意，轴从 -10 开始，到 10 停止，中间为 0。我希望每条 0 线的宽度或颜色都与其他线不同
audio - 单线 FFMPEG cmd 合并视频/音频并保留两个音频
我有一个项目需要将一个视频文件与另一个音频文件合并。预期的输出是一个视频文件，其中包含来自实际视频的音频和合并后的音频文件。输出视频文件的长度将与实际视频文件的大小相同。是否有单行 FFMPEG 命
用于 2 个列表字符串格式的 Python 3 单线？
我在 python3 类中有 2 个列表: self.keys = ["a","b","c","d"] self.values = [1,2,3,4] len(self.keys) == len(se
python - 用于将不等长 np.array 组合到矩阵(或二维数组)的 numpy 单线
我有一个不同长度的数组列表，我想将它们组合成一个最大维度的矩阵，并在末尾填充零。例如(伪代码): combine( [1,2,3], [4,5]) [[1,2,3],[4,5,0]] 这是我目前的解决
第 i 个位置为 1 的 n 向量的 Matlab/Octave 单线
例如，给定 i=5 和 n=8，我想生成 [0;0;0;0;1;0; 0;0]。具体来说，我想生成向量 v 以便: v = zeros(n,1); v(i) = 1; 有没有一种(合理的)方法可以在一

首页

博学

6Ren·AI

商城

c - 单线程模式下并行合并非常慢