performance - 单链表的并行排序

转载作者：塔克拉玛干更新时间：2023-11-03 02:41:10

25

4

是否有任何算法可以使链表的并行排序值得？

众所周知Merge Sort是用于对 linked list 进行排序的最佳算法.

大多数合并排序都是根据数组来解释的，每一半都是递归排序的。这将使并行化变得微不足道:独立地对每一半进行排序，然后合并两半。

但是链表没有“中途”点；一个链表一直到它结束:

Head → [a] → [b] → [c] → [d] → [e] → [f] → [g] → [h] → [i] → [j] → ...

我现在的实现会遍历列表一次以获得计数，然后递归地拆分计数，直到我们将节点与其 NextNode 进行比较。递归负责记住两半的位置。

这意味着链表的 MergeSort 在整个列表中线性进行。因为它似乎要求通过列表线性前进，所以我认为它不能并行化。我能想到的唯一方法是:

遍历列表以获得计数 O(n)
走一半列表到达中点 O(n/2)
然后对每一半进行排序 O(n log n)

但即使我们在单独的线程中并行排序 (a,b) 和 (c,d)，我认为 NextNode 重新排序期间的错误共享会破坏并行化的任何优势。

是否有并行算法对链表进行排序？

数组合并排序算法

这是对数组执行归并排序的标准算法:

algorithm Merge-Sort
    input:
        an array, A (the values to be sorted)
        an integer, p (the lower bound of the values to be sorted)
        an integer, r (the upper bound of the values to be sorted)

    define variables:
        an integer, q (the midpoint of the values to be sorted)

    q ← ⌊(p+r)/2⌋
    Merge-Sort(A, p, q)   //sort the lower half
    Merge-Sort(A, q+1, r) //sort the upper half   
    Merge(A, p, q, r)

该算法是为具有任意索引访问的数组设计的，也意味着它。为了使其适用于链表，必须对其进行修改。

链表合并排序算法

这是(单线程)单链表，归并排序，我目前用来对单链表进行排序的算法。它来自 Gonnet + Baeza Yates Handbook of Algorithms

algorithm sort:
    input:
        a reference to a list, r (pointer to the first item in the linked list)
        an integer, n (the number of items to be sorted)
    output:
        a reference to a list (pointer to the sorted list)
    
    define variables:
        a reference to a list, A (pointer to the sorted top half of the list)
        a reference to a list, B (pointer to the sorted bottom half of the list)
        a reference to a list, temp (temporary variable used to swap)

    if r = nil then
        return nil

    if n > 1 then
        A ← sort(r, ⌊n/2⌋ )
        B ← sort(r, ⌊(n+1)/2⌋ )
        return merge( A, B )

    temp ← r
    r ← r.next
    temp.next ← nil
    return temp

A Pascal implementation会是:

function MergeSort(var r: list; n: integer): list;
begin
   if r = nil then 
       Result := nil
   else if n > 1 then
      Result := Merge(MergeSort(r, n div 2), MergeSort(r, (n+1) div 2) )
   else
   begin
      Result := r;
      r := r.next;
      Result.next := nil;
   end
end;

如果我的转码有效，这里是一个即时的 C# 翻译:

list function MergeSort(ref list r, Int32 n)
{
   if (r == null)
      return null;

    if (n > 1)
    {
       list A = MergeSort(r, n / 2);
       list B = MergeSort(r, (n+1) / 2);
       return Merge(A, B);
    }
    else
    {
       list temp = r;
       r = r.next;
       temp.next = null;
       return temp;
    }
}

我现在需要的是一个对链表进行排序的并行算法。它不一定是归并排序。

有些人建议复制接下来的 n 项，其中 n 项适合单个缓存行，并使用这些项生成一个任务。

示例数据

algorithm GenerateSampleData
    input:
        an integer, n (the number of items to generate in the linked list)
    output:
        a reference to a node (the head of the linked list of random data to be sorted)

    define variables:
        a reference to a node, head (the returned head)
        a reference to a node, item (an item in the linked list)
        an integer, i (a counter)

    head ← new node
    item ← head        

    for i ← 1 to n do
        item.value ← Random()
        item.next ← new node
        item ← item.next

    return head

因此我们可以通过调用生成一个包含 300,000 个随机项目的列表:

head := GenerateSampleData(300000);

基准

Time to generate 300,000 items    568 ms

MergeSort 
    count splitting variation   3,888 ms (baseline)

MergeSort
    Slow-Fast midpoint finding  3,920 ms (0.8% slower)

QuickSort
    Copy linked list to array       4 ms
    Quicksort array             5,609 ms
    Relink list                     5 ms
    Total                       5,625 ms (44% slower)

红利阅读

计算器:What's the fastest algorithm for sorting a linked list?
计算器:Merge Sort a Linked List
Mergesort For Linked Lists
Parallel Merge Sort O(log n) pdf, 1986
计算器:Parallel Merge Sort (关闭，以典型的 SO nerd-rage 方式)
Parallel Merge Sort 博士多布斯，2012 年 3 月 24 日
Eliminate False Sharing 博士多布斯，2009 年 3 月 14 日
Mergesort For Linked Lists , Simon Tatham(因 Putty 而出名)

最佳答案

Mergesort 非常适合并行排序。将列表分成两半，对每一半进行并行排序，然后合并结果。如果您需要两个以上的并行排序过程，请递归执行。如果您碰巧没有无限多的 CPU，则可以在一定的回溯深度(您必须通过测试来确定)省略并行化。

顺便说一句，将列表分成大致相同大小的两半的常用方法是 Floyd 的循环查找算法，也称为兔子和乌龟方法:

Node MergeSort(Node head)
{
   if ((head == null) || (head.Next == null))
      return head; //Oops, don't return null; what if only head.Next was null

   Node firstHalf = head;
   Node middle = GetMiddle(head);
   Node secondHalf = middle.Next;
   middle.Next = null; //cut the two halves

   //Sort the lower and upper halves
   firstHalf = MergeSort(firstHalf);
   secondHalf = MergeSort(secondHalf);

   //Merge the sorted halves 
   return Merge(firstHalf, secondHalf);
}

Node GetMiddle(Node head)
{
   if (head == null || head.Next == null)
       return null;

   Node slow = head;
   Node fast = head;
   while ((fast.Next != null) && (fast.Next.Next != null))
   {
       slow = slow.Next;
       fast = fast.Next.Next;
   }
   return slow;
}

之后，list 和list2 是两个大小大致相同的列表。连接它们将产生原始列表。当然，fast = fast->next->next需要进一步注意；这只是为了演示一般原则。

enter image description here

关于performance - 单链表的并行排序，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19738326/

25

4

0

文章推荐： c# - asp .net mvc 中带有 View 模型的多个路由参数

文章推荐： seo - 我是否以正确的方式使用我的元标签？

文章推荐： Magento:具有多商店设置的 hreflang 元标记

文章推荐： seo - Google 不会将我的网站页面编入索引

排序
我正在尝试对每个条目有多个值的关联数组进行排序。例如 [0] => stdClass Object ( [type] => node [sid] => 158 [score] => 0.059600
mysql - 排序 - 按日期 ASC 排序
我在 mysql 中有“日期”列以这种格式保存日期 2014 年 9 月 17 日(日-月-年) 我需要对它们进行升序排序，所以我使用了这个命令: SELECT * FROM table ORDER
MySQL 排序，限制为 MS SQL 排序
我目前正在将 MySQL 存储过程重写为 MS SQL 存储过程，但遇到了问题。在 MySQL 存储过程中，有一个游标，它根据最近的日期 (effdate) 选择一个值并将其放入变量 (thestt
java - 通过从 mysql 中选择(排序)排序
我想要 gwt r.QuestionId- 排序。但是我得到未排序的 QuestionId 尽管我提到了 QuestionId ASC 的顺序。 SELECT r.QuestionId,
Python scandir() 排序\POSIX readdir 排序
我有一个关于在 scandir 函数中排序的基本问题。到目前为止，我阅读了 POSIX readdir 的手册页，但没有找到有关订购保证的具体信息。但是当我遍历大目录(无法更改，只读)时，我在多个系
sql - 排序、排序、筛选 SQL Server 的复杂组合
基本上我必须从 SQL 数据库中构建项目列表，但是用户可以选择对 7 个过滤器的任意组合进行过滤，也可以选择要排序的列以及按方向排序。正如您可以想象的那样，这会以大量不同的组合进行编码，并且数据集非
mysql - 按日期 ASC 排序，但组内按 DESC 排序
我有两张 table 。想象第一个是一个目录，包含很多文件(第二个表)。第二个表(文件)包含修改日期。现在，我想选择所有目录并按修改日期 ASC 对它们进行排序(因此，最新的修改最上面)。我不想显
mysql - 首先按(条件)排序，然后按(条件)排序
我想先根据用户的状态然后根据用户名来排序我的 sql 请求。该状态由 user_type 列设置: 1=活跃，2=不活跃，3=创始人。我会使用此请求来执行此操作，但它不起作用，因为我想在“活跃”成员
c++ - sort a, b, c是否等同于sort c；排序 b;排序？
在 C++ 中，我必须实现一个“类似 Excel/Access”(引用)的查询生成器，以允许对数据集进行自定义排序。如果您在 Excel 中使用查询构建器或 SQL 中的“ORDER BY a, b,
MongoDB 按字段 A 排序，如果字段 B != null 否则按字段 C 排序
我面临这样的挑战: 检索按字段 A 排序的文档如果字段 B 存在/不为空 . 否则按字段排序 C. 在 SQL 世界中，我会做两个查询并创建一个 UNION SELECT，但我不知道如何从 Mon
dart - 在 Dart 中，如何仅使用级联或链式调用来干净地映射/排序/折叠/排序/扩展？
我想对源列表执行以下操作: map 列表排序折叠排序展开列表其中一些方法(例如map和toList)是可链接的，因为它们返回非空对象。但是，sort 方法返回 void，因为它对 List
linux - 有人可以解释重新格式化 awk () | 输出的最佳方法吗？排序 | uniq-c |排序-rg？
我制作了一个用于分析 Windows 日志消息编号的脚本。 uniq -c 数字的输出很难预测，因为根据数字的大小会有不同的空白。此时，我手动删除了空白。这是对消息进行排序和计数的命令: cat n
python - 在 Python 字典中按值(降序)排序，然后按键(升序)排序
我有以下词典: mydict1 = {1: 11, 2: 4, 5: 1, 6: 1} mydict2 = {1: 1, 5: 1} 对于它们中的每一个，我想首先按值(降序)排序，然后按键(升序)排序
delphi - 如何使用多个比较器在 TObjectList<> 中进行类似于 Excel 的按 A 排序，然后按 B 排序
我刚刚开始使用泛型，目前在对多个字段进行排序时遇到问题。案例: 我有一个 PeopleList 作为 TObjectList我希望能够通过一次选择一个排序字段，但尽可能保留以前的排序来制作类似 Ex
sql - 如果 Column1 不为空，则按 Column1 排序，否则按 Column2 排序
有没有办法在 sql 中组合 ORDER BY 和 IS NULL 以便我可以在列不为空时按列排序，但如果它为null，按另一列排序？最佳答案类似于: ORDER BY CASE WHEN
mysql - 排序 mysql 结果。按 col1 排序，按 col2 分组
我有一个包含 2 列“id”和“name”的表。 id 是常规的自动增量索引，name 只是 varchar。 id name 1 john 2 mary 3 pop 4 mary 5 j
node.js - API 分页、过滤、排序 VS CLIENT 分页、过滤、排序
场景网站页面有一个带有分页、过滤、排序功能的表格 View 。表中的数据是从REST API服务器获取的，数据包含数百万条记录。数据库 REST API 服务器 Web 服务器浏览器问
objective-c - 获取 NSDictionary 键的 NSArray，按 Value 排序，然后按 Key 排序
假设我有一本字典，其中的键(单词)和值(分数)如下: GOD 8 DONG 16 DOG 8 XI 21 我想创建一个字典键(单词)的 NSArray，首先按分数排序，然后按字
mysql - sphinx 搜索查询前 20 个按标题 WEIGHT 排序，后 20 个按标题 ASC 排序，无重复输出
如何在 sphinx 上通过 sql 命令选择前 20 行按标题 WEIGHT 排序，接下来 20 行按标题 ASC 排序(总共 40 个结果)，但不要给出重复的标题输出。我尝试了这个 sql 命令
SQLite - 排序
我有一个奇怪的问题，当从 SQLite 数据库中选择信息并根据日期排序时，返回的结果无效。我的SQL语句是这样的: Select pk from usersDates order by dateti

首页

博学

6Ren·AI

商城

performance - 单链表的并行排序

数组合并排序算法

链表合并排序算法

示例数据

基准

红利阅读