c - 为什么复杂的 memcpy/memset 更胜一筹？-6ren

c - 为什么复杂的 memcpy/memset 更胜一筹？

转载作者：太空狗更新时间：2023-10-29 16:25:38

25

4

在调试的时候，经常会踩到memcpy和memset的手写汇编实现。这些通常使用流指令(如果可用)、循环展开、对齐优化等来实现……我最近也遇到了这个 'bug' due to memcpy optimization in glibc .

问题是:为什么硬件厂商(Intel、AMD)不能针对具体情况进行优化？

rep stos

和

rep movs

被认可，并在他们自己的架构上尽可能快地填充和复制？

最佳答案

我想添加到其他答案中的一件事是 rep movs在所有现代处理器上实际上并不慢。例如，

Usually, the REP MOVS instruction has a large overhead for choosing and setting up the right method. Therefore, it is not optimal for small blocks of data. For large blocks of data, it may be quite efficient when certain conditions for alignment etc. are met. These conditions depend on the specific CPU (see page 143). On Intel Nehalem and Sandy Bridge processors, this is the fastest method for moving large blocks of data, even if the data are unaligned.

[突出显示是我的。] 引用: Agner Fog, Optimizing subroutines in assemblylanguageAn optimization guide for x86 platforms. ，页。 156(另见第 16.10 节，第 143 页)[2011-06-08 版本]。

关于c - 为什么复杂的 memcpy/memset 更胜一筹？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8858778/

25

4

0

文章推荐： android - BottomNavigationView 不存在

文章推荐： android - 订阅的结果没有在 rxjava 上使用

文章推荐： android - 添加东西到 Android DialogFragment 的背景

文章推荐： c - 如何在内存中缓冲标准输出并从专用线程写入它

memcpy - memcpy 不安全吗？
这个问题在这里已经有了答案: 关闭 13 年前。重复: Memcpy() in secure programming? 根据“Please Join me in welcoming memcpy(
memcpy - memcpy 不安全吗？
这个问题在这里已经有了答案: 关闭 13 年前。重复: Memcpy() in secure programming? 根据“Please Join me in welcoming memcpy(
memcpy - strncpy/memcpy/memmove是逐字节还是以另一种有效方式复制数据？
众所周知，在x86 / x86_64之类的多字节字计算机中，逐字节地复制/移动大量内存(每步4或8个字节)要比逐字节地复制/移动更为有效。我很好奇strncpy / memcpy / memmove
c - memcpy--memcpy 后内核崩溃
我需要帮助，我正在尝试使用 memcpy 在内核空间复制 header ，但屏幕变黑，看起来它不喜欢我的 memcpy。请有人帮助我。 remaining = ntohs(iphead
c - 第二个 memcpy() 将之前的 memcpy() 数组附加到它
我在使用 memcpy() 时遇到了一点问题当我写这篇文章时 char ipA[15], ipB[15]; size_t b = 15; memcpy(ipA,line+15,b); 它从数组 li
c - 如果 memcpy 实际上不返回任何内容，如何以 memcpy 作为第一个参数调用 memset？
我正在尝试将一些 libc 代码移植到 Rust。具体来说，__tcgetattr()函数found in this file . 我只有一个部分遇到问题。 if (sizeof (cc_t) ==
c++ - 为什么调用 memcpy 到 bool 值后 memcpy 到 int 不起作用
我在玩 memcpy 时偶然发现了一个奇怪的结果，在 bool memcpy 之后对同一内存指针调用的 memcpy 给出了意想不到的结果。我创建了一个简单的测试结构，其中包含一堆不同类型的变量。我
c - Memcpy func 获取指针变量？字符*p；字符* q； memcpy(p,q,10);会起作用吗？
Memcpy 和 memcmp 函数可以接受指针变量吗？ char *p; char* q; memcpy(p,q,10); //will this work? memcmp(p,q,10); //w
c++ - 当从这个 memcpy 到子类中的新对象时，警告 "destination for this ' memcpy' call is a pointer to dynamic class ...”显示
我将创建一些具有虚拟复制功能的父类和子类，它返回自身的拷贝: class A{ public: int ID; virtual A* copy(){ retur
memcpy 可以用于类型双关吗？
这是引用自 C11 标准: 6.5 Expressions ... 6 The effective type of an object for an access to its stored valu
C memcpy 二维数组
我正在尝试使用 memcpy 将一个二维数组复制到另一个。我的代码: #include #include int print(int arr[][3], int n) { for (int
C memcpy 到结构分配
我编写了一个简单的程序来测试使用 memcpy 将字节从字节缓冲区复制到结构。但是我没有得到预期的结果。我分配了一个 100 字节的缓冲区，并将值设置为 0、1、2...99。然后我将这些字节复制到
c++ - memcpy 是否保留了琐碎对象的有效性？
如果有一个普通类型的有效对象(在这种情况下，普通类型满足普通移动/复制可构造的概念)，并且一个 memcpy 将它放到未初始化的内存区域，复制的内存区域是有效对象吗？我读到的假设:一个对象只有在它的
c++ - memcpy - 获取临时数组错误的地址
我正在研究 Arduino 并尝试更改数组的元素。在设置之前，我像这样初始化数组: bool updateArea[5] = { false }; 然后我想像这样更改数组: updateArea[0]
cuda - Memcpy 上未指定的启动失败
在 Cuda 中运行我的程序时遇到“未指定的启动失败”。我检查了错误。该程序是一个微分方程的求解器。它迭代 TOTAL_ITER 次。 ROOM_X 和 ROOM_Y 是矩阵的宽度和高度。这是标
c - memcpy 什么都不做
我试图将双缓冲放入我的 VGA dos 程序中，但是当我使用 memcpy 函数时似乎出现了问题。我确信我分配了所需的内存，但它似乎不起作用。程序如下: #include #include u
c - Memcpy() 适用于越界内存？
我一直认为 memcpy() 可以用于恶意目的。我做了几个测试应用程序，看看我是否可以从不同区域“窃取”内存中的数据。到目前为止，我已经测试了三个区域，堆、堆栈和常量(只读)内存。在我的测试中，常量内
不使用 memcpy() 复制字节
这是一项家庭作业。我想实现 memcpy()。有人告诉我内存区域不能重叠。其实我不明白那是什么意思，因为这段代码工作正常，但是有内存重叠的可能性。如何预防？ void *mem_copy(void *
c - memcpy 启动索引真的需要吗？
问题是，当我们使用 memcpy() 复制任何字节数组时，我们应该明确声明目标缓冲区的起始(第 0 个)索引，还是简单地提及它就足够了。让我展示我在说什么的例子。假设我们正在尝试将源缓冲区复制到目标缓
c memcpy 按值结构
我只是想将一个结构复制到另一个结构(按值复制，而不是按引用复制)。这是完整的工作代码 /* memcpy example */ #include #include #include #defin

首页

博学

6Ren·AI

商城

c - 为什么复杂的 memcpy/memset 更胜一筹？