C - 交换两个相同大小的内存块的最快方法？-6ren

C - 交换两个相同大小的内存块的最快方法？

转载作者：IT王子更新时间：2023-10-28 23:32:42

24

4

交换两个相同大小的非重叠内存区域的最快方法是什么？比如说，我需要用 (t_Some *b) 交换 (t_Some *a)。考虑时空权衡，增加临时空间会提高速度吗？例如，(char *tmp) vs (int *tmp)?我正在寻找一种可移植解决方案。

原型(prototype):

void swap_elements_of_array(void* base, size_t size_of_element, int a, int b);

最佳答案

移动内存块的最快方法是memcpy()来自 <string.h> .如果您 memcpy()来自 a至temp , memmove()来自 b至a ，然后 memcpy()来自 temp至b ，你将有一个使用优化的库例程的交换，编译器可能内联。您不想一次复制整个 block ，而是以 vector 大小的 block 的形式复制。

在实践中，如果你编写了一个紧密循环，编译器可能会告诉你正在交换数组的每个元素并进行相应的优化。在大多数现代 CPU 上，您希望生成 vector 指令。如果您确保所有三个缓冲区都对齐，它可能能够生成更快的代码。

但是，您真正想做的是让优化器更轻松。参加这个程序:

#include <stddef.h>

void swap_blocks_with_loop( void* const a, void* const b, const size_t n )
{
  unsigned char* p;
  unsigned char* q;
  unsigned char* const sentry = (unsigned char*)a + n;

  for ( p = a, q = b; p < sentry; ++p, ++q ) {
     const unsigned char t = *p;
     *p = *q;
     *q = t;
  }
}

如果你把它翻译成机器代码，那么这是一个糟糕的算法，一次复制一个字节，每次迭代做两个增量，等等。但在实践中，编译器会看到你真正想要做什么。

在带有 -std=c11 -O3 的 clang 5.0.1 中，它(部分)在 x86_64 上产生以下内部循环:

.LBB0_7:                                # =>This Inner Loop Header: Depth=1
        movups  (%rcx,%rax), %xmm0
        movups  16(%rcx,%rax), %xmm1
        movups  (%rdx,%rax), %xmm2
        movups  16(%rdx,%rax), %xmm3
        movups  %xmm2, (%rcx,%rax)
        movups  %xmm3, 16(%rcx,%rax)
        movups  %xmm0, (%rdx,%rax)
        movups  %xmm1, 16(%rdx,%rax)
        movups  32(%rcx,%rax), %xmm0
        movups  48(%rcx,%rax), %xmm1
        movups  32(%rdx,%rax), %xmm2
        movups  48(%rdx,%rax), %xmm3
        movups  %xmm2, 32(%rcx,%rax)
        movups  %xmm3, 48(%rcx,%rax)
        movups  %xmm0, 32(%rdx,%rax)
        movups  %xmm1, 48(%rdx,%rax)
        addq    $64, %rax
        addq    $2, %rsi
        jne     .LBB0_7

而具有相同标志的 gcc 7.2.0 也向量化，展开循环更少:

.L7:
        movdqa  (%rcx,%rax), %xmm0
        addq    $1, %r9
        movdqu  (%rdx,%rax), %xmm1
        movaps  %xmm1, (%rcx,%rax)
        movups  %xmm0, (%rdx,%rax)
        addq    $16, %rax
        cmpq    %r9, %rbx
        ja      .L7

说服编译器一次生成对单个单词起作用的指令，而不是对循环进行矢量化，这与您想要的相反!

关于C - 交换两个相同大小的内存块的最快方法？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8166502/

24

4

0

文章推荐：安卓工作室 : eglSurfaceAttrib not implemented

文章推荐： android - Android 2.2 上的多播

文章推荐： android - 在android浏览器中打开一个url，避免多个标签

clojure - 交换!改变和相似
我在理解这些函数如何更新底层引用、原子等时遇到问题。文档说:(应用当前身份值参数) (def one (atom 0)) (swap! one inc) ;; => 1 所以我想知道它是如何“扩展到
Clojurescript 交换!和多个关联
尝试让一段代码看起来更好。我在 Clojurescript 中有以下内容: (swap! app-state assoc-in [:lastresults] []) (swap! app-state
java - 交换/重新排序记录
我在数据库中有带有排序顺序号的记录。现在我想创建一个带有向上和向下按钮的用户界面来重新排序它们。制作两个 functionsUp(record) 和 functionDown(record) 的最佳算
jquery div 交换
如何才能让第二次点击时返回？我想我必须以某种方式找到活跃的，但不确定。 $("#test").click(function(){ $("#dsa").fadeOut() $("#asd
c - 反转字符串(交换)
我需要有关这次考试的帮助。我需要反转输入字符串。 int main(void) { char str[30]; int strlen; int i=0; int count=0;int
C 指针 - 交换
我正在用 C 语言玩指针...我尝试编写一个接收指向值的指针、检索指针的指针并交换指向值的指针的交换，而不是接收指向值的指针和交换值的常规交换。这是代码... 互换功能: void swap(voi
JavaScript 切换/交换
如何在 javascript 中切换值？例如，如果 x = apple，则函数应返回 x = orange。如果 x = orange，则函数应返回 x = apple。不确定，这里有什么用，切换或交
C++ 交换 unique_ptr's
刚接触这类东西，可能做错了什么，但是- 我有 3 个成员 std::unique_ptr currentWeapon; std::unique_ptr weaponSlotOne; std::uniq
javascript - 如何对不可变映射内的项目进行排序(交换)？
我想在 Map 内的不可变列表内交换项目，示例: const Map = Immutable.fromJS({ name:'lolo', ids:[3,4,5] }); 我正在尝试使用
c - 交换/交换指针时的未定义行为
我创建了动态数组。如果具有某些值，则填充。打印它。但是交换/交换指针后(任务是在特定条件下交换行) 条件取决于sumL。为了不浪费您的时间，我没有描述细节。问题在于交换指针。 for ( k = 0
c++ - 中途反转/交换
要反转整个 vector，存在 std::reverse。但我想将一个 vector “划分”为两部分(恰好在中间)并将两者反转，将它们放回一起并再次反转整个 vector 。例如我们有: 0 1 2
java - 交换 if 语句
我正在致力于代码最小化和增强。我的问题是:是否可以在不破坏代码逻辑的情况下交换上面的 if 语句？ int c1 = Integer.parseInt(args[0]) ; int c
c++ - 交换 vector 以释放它
我读过释放 vector 内存的最佳方法是: vector().swap(my_vector); 而且我真的不明白发生了什么。交换函数需要 2 个 vector 并交换它们的元素，例如: vector
string - 交换 Haskell 字符串中的多对字符
我正在尝试编写一个 Haskell 函数，该函数接受一串字母对，并在所有字母组成的字符串中交换该对字母，但我想出的方法感觉很尴尬且不惯用。我有 swap a b = map (\x-> if x =
jquery - 交换 jQuery 中的两个元素
我正在尝试使用向上和向下箭头交换两个元素。 JSFiddle 解决方案会很棒! 我的 HTML: Some text down Some ot
cocoa - 自动布局 View 交换
当将 subview 与另一个太阳 View 交换时，是否需要重新应用约束？是否需要删除适用于已删除 View 的约束？或者它们应该自动持续存在？最佳答案约束是 View 的“一部分”。当您删除
javascript - 交换 AngularJS 语法导致错误
所以我制作网站已经有一段时间了，但只是真正用于显示和信息的东西。我想尝试一下 AngularJs，所以我遵循了 Codeschool 上的指南。当我根据在线文档意识到我使用的语法不被推荐时，我在该应用
javascript - 交换 unicode 字符
我正在尝试编写一个函数，可以将字符串中的 unicode 字符替换为非 unicode ASCII 字符，问题是上传包含它们的字符串时，unicode 连字符和引号不会被读取。我希望该函数有一个带有
Azure 网站和 VIP 交换
我目前正在使用 Azure 网站来部署我的应用程序。我目前正在使用两个网站，每个网站监听我的 GIT 的不同分支。如图所示here . 现在，为了让它变得完美，我只是缺少一种在这两个实例之间快速切换的
javascript - 交换
标签中的值？
在我的 javascript 中，有两个包含一些值的 div。我想交换这些div中的值。有什么解决办法吗？最佳答案 var temp = $('#div1').html(); $('#div1'

首页

博学

6Ren·AI

商城

C - 交换两个相同大小的内存块的最快方法？