- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
下面是我在搜索优化的 memcpy
实现时获得的代码。
这是link
void *memcpy(void *dst, void const *src, size_t len) {
long *plDst = (long *)dst;
long const *plSrc = (long const *)src;
if (!(src & 0xFFFFFFFC) && !(dst & 0xFFFFFFFC)) {
while (len >= 4) {
*plDst++ = *plSrc++;
len -= 4;
}
}
char *pcDst = (char *)plDst;
char const *pcDst = (char const *)plSrc;
while (len--) {
*pcDst++ = *pcSrc++;
}
return (dst);
}
有人可以向我解释一下下面这行吗?
if (!(src & 0xFFFFFFFC) && !(dst & 0xFFFFFFFC))
这里他们想要检查src
和dst
地址是否与4字节
边界对齐。为什么他们要使用 !
,因为它每次都会使条件 false
?
其次,上述代码是否还有进一步优化的余地?
最佳答案
本文虽然讨论了一个有趣的主题,但未能提供正确的示例。发布的代码被称为 GNU 的 newlib 源代码。 GNU 项目和 newlib 团队都会惊讶地发现这个意想不到的收敛声明! newlib 不是一个 GNU 项目,它的大部分源代码都没有获得 GPL 许可。
这个优化的memcpy
实现是不可移植的、次优的并且在许多方面都是不正确的。
测试 if (!(src & 0xFFFFFFFC) && !(dst & 0xFFFFFFFC))
尝试检测 src
和 dst
地址在长
边界上对齐。由于多种原因,它很麻烦且不可移植,而且正如您所注意到的那样,它是完全错误的:
void *
到int
的隐式转换是丑陋的并且是实现定义的。为了更好的可移植性,指针应转换为 (uintptr_t)
。0xFFFFFFFC
假定类型 long
为 4 个字节。这可能不正确,事实上,在 64 位 Linux 和 Mac 系统上,long
类型的长度是 8 字节。src & 0xFFFFFFC
不是对齐检查,不太可能是 0
,4 字节边界对齐的预期测试是 src & 3
。此外,代码无法优化 src
和 dst
具有相同对齐方式但未在 long
边界上对齐的情况。
其他可能的改进包括展开循环、使用小值 len
的开关、将从 src
读取的字节组合到 long
中以一旦它在长
边界上对齐,就写入dst
...
这是一个改进的替代方案:
#include <stdint.h>
void *memcpy(void *dst, void const *src, size_t len) {
unsigned char *pcDst = (unsigned char *)dst;
unsigned char const *pcSrc = (unsigned char const *)src;
if (len >= sizeof(long) * 2
&& ((uintptr_t)src & (sizeof(long) - 1)) == ((uintptr_t)dst & (sizeof(long) - 1))) {
while (((uintptr_t)pcSrc & (sizeof(long) - 1)) != 0) {
*pcDst++ = *pcSrc++;
len--;
}
long *plDst = (long *)pcDst;
long const *plSrc = (long const *)pcSrc;
/* manually unroll the loop */
while (len >= sizeof(long) * 4) {
plDst[0] = plSrc[0];
plDst[1] = plSrc[1];
plDst[2] = plSrc[2];
plDst[3] = plSrc[3];
plSrc += 4;
plDst += 4;
len -= sizeof(long) * 4;
}
while (len >= sizeof(long)) {
*plDst++ = *plSrc++;
len -= sizeof(long);
}
pcDst = (unsigned char *)plDst;
pcSrc = (unsigned char const *)plSrc;
}
while (len--) {
*pcDst++ = *pcSrc++;
}
return dst;
}
请注意,void *
的转换在 C 中是不必要的,但在 C++ 中是必需的。
在尝试优化代码以提高速度时,请记住以下一些要点:
memcpy
通常在汇编中进行优化,或者由现代编译器作为内置函数实现。关于c - Memcpy 实现的优化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51494787/
这个问题在这里已经有了答案: 关闭 13 年前。 重复: Memcpy() in secure programming? 根据“Please Join me in welcoming memcpy(
这个问题在这里已经有了答案: 关闭 13 年前。 重复: Memcpy() in secure programming? 根据“Please Join me in welcoming memcpy(
众所周知,在x86 / x86_64之类的多字节字计算机中,逐字节地复制/移动大量内存(每步4或8个字节)要比逐字节地复制/移动更为有效。 我很好奇strncpy / memcpy / memmove
我需要帮助,我正在尝试使用 memcpy 在内核空间复制 header ,但屏幕变黑,看起来它不喜欢我的 memcpy。请有人帮助我。 remaining = ntohs(iphead
我在使用 memcpy() 时遇到了一点问题 当我写这篇文章时 char ipA[15], ipB[15]; size_t b = 15; memcpy(ipA,line+15,b); 它从数组 li
我正在尝试将一些 libc 代码移植到 Rust。具体来说,__tcgetattr()函数found in this file . 我只有一个部分遇到问题。 if (sizeof (cc_t) ==
我在玩 memcpy 时偶然发现了一个奇怪的结果,在 bool memcpy 之后对同一内存指针调用的 memcpy 给出了意想不到的结果。 我创建了一个简单的测试结构,其中包含一堆不同类型的变量。我
Memcpy 和 memcmp 函数可以接受指针变量吗? char *p; char* q; memcpy(p,q,10); //will this work? memcmp(p,q,10); //w
我将创建一些具有虚拟复制功能的父类和子类,它返回自身的拷贝: class A{ public: int ID; virtual A* copy(){ retur
这是引用自 C11 标准: 6.5 Expressions ... 6 The effective type of an object for an access to its stored valu
我正在尝试使用 memcpy 将一个二维数组复制到另一个。我的代码: #include #include int print(int arr[][3], int n) { for (int
我编写了一个简单的程序来测试使用 memcpy 将字节从字节缓冲区复制到结构。但是我没有得到预期的结果。 我分配了一个 100 字节的缓冲区,并将值设置为 0、1、2...99。然后我将这些字节复制到
如果有一个普通类型的有效对象(在这种情况下,普通类型满足普通移动/复制可构造的概念),并且一个 memcpy 将它放到未初始化的内存区域,复制的内存区域是有效对象吗? 我读到的假设:一个对象只有在它的
我正在研究 Arduino 并尝试更改数组的元素。在设置之前,我像这样初始化数组: bool updateArea[5] = { false }; 然后我想像这样更改数组: updateArea[0]
在 Cuda 中运行我的程序时遇到“未指定的启动失败”。 我检查了错误。 该程序是一个微分方程的求解器。它迭代 TOTAL_ITER 次。 ROOM_X 和 ROOM_Y 是矩阵的宽度和高度。 这是标
我试图将双缓冲放入我的 VGA dos 程序中,但是当我使用 memcpy 函数时似乎出现了问题。 我确信我分配了所需的内存,但它似乎不起作用。 程序如下: #include #include u
我一直认为 memcpy() 可以用于恶意目的。我做了几个测试应用程序,看看我是否可以从不同区域“窃取”内存中的数据。到目前为止,我已经测试了三个区域,堆、堆栈和常量(只读)内存。在我的测试中,常量内
这是一项家庭作业。我想实现 memcpy()。有人告诉我内存区域不能重叠。其实我不明白那是什么意思,因为这段代码工作正常,但是有内存重叠的可能性。如何预防? void *mem_copy(void *
问题是,当我们使用 memcpy() 复制任何字节数组时,我们应该明确声明目标缓冲区的起始(第 0 个)索引,还是简单地提及它就足够了。让我展示我在说什么的例子。假设我们正在尝试将源缓冲区复制到目标缓
我只是想将一个结构复制到另一个结构(按值复制,而不是按引用复制)。这是完整的工作代码 /* memcpy example */ #include #include #include #defin
我是一名优秀的程序员,十分优秀!