gpt4 book ai didi

objective-c - 确保内存区域为空白(全部为 NULL)的最快方法?

转载 作者:可可西里 更新时间:2023-11-01 03:09:13 26 4
gpt4 key购买 nike

如果我有一个 unsigned char *data 指针,我想检查该指针处数据的 size_t length 是否为 NULL,最快的方法是什么去做?换句话说,确保内存区域为空白的最快方法是什么?

我在 iOS 中实现,因此如果有帮助,您可以假设 iOS 框架可用。另一方面,简单的 C 方法(memcmp 等)也可以。

请注意,我不是试图清除内存,而是试图确认它已经清除(我试图找出是否有任何东西在所有在一些位图数据中,如果有帮助的话)。例如,我认为以下方法可行,但我还没有尝试过:

- BOOL data:(unsigned char *)data isNullToLength:(size_t)length {
unsigned char tester[length] = {};
memset(tester, 0, length);
if (memcmp(tester, data, length) != 0) {
return NO;
}
return YES;
}

不过,我宁愿不创建测试器数组,因为源数据可能非常大,我宁愿避免为测试分配内存,即使是暂时的。但我可能在那里太保守了。

更新:一些测试

感谢大家在下面的精彩回复。我决定创建一个测试应用程序来查看它们的性能,答案让我感到惊讶,所以我想我应该分享它们。首先,我将向您展示我使用的算法版本(在某些情况下,它们与建议的算法略有不同),然后我将分享该领域的一些结果。

测试

首先我创建了一些示例数据:

    size_t length = 1024 * 768;
unsigned char *data = (unsigned char *)calloc(sizeof(unsigned char), (unsigned long)length);
int i;
int count;
long check;
int loop = 5000;

每个测试都包含一个循环运行 loop 次。在循环期间,一些随机数据被添加到 data 字节流中或从中删除。请注意,一半时间实际上没有添加数据,因此一半时间测试不应该找到任何非零数据。请注意,testZeros 调用是调用以下测试例程的占位符。定时器在循环之前启动并在循环之后停止。

    count = 0;
for (i=0; i<loop; i++) {
int r = random() % length;
if (random() % 2) { data[r] = 1; }
if (! testZeros(data, length)) {
count++;
}
data[r] = 0;
}

测试 A:nullToLength。这或多或少是我上面的原始公式,经过一些调试和简化。

- (BOOL)data:(void *)data isNullToLength:(size_t)length {
void *tester = (void *)calloc(sizeof(void), (unsigned long)length);
int test = memcmp(tester, data, length);
free(tester);
return (! test);
}

测试 B:全零。 Carrotman 的提议。

BOOL allZero (unsigned char *data, size_t length) {
bool allZero = true;
for (int i = 0; i < length; i++){
if (*data++){
allZero = false;
break;
}
}
return allZero;
}

测试 C:is_all_zero。伦丁提议。

BOOL is_all_zero (unsigned char *data, size_t length)
{
BOOL result = TRUE;
unsigned char* end = data + length;
unsigned char* i;

for(i=data; i<end; i++) {
if(*i > 0) {
result = FALSE;
break;
}
}

return result;
}

测试 D:sumArray。这是来自 nearly duplicate question 的最佳答案, 由 vladr 提出。

BOOL sumArray (unsigned char *data, size_t length) {
int sum = 0;
for (int i = 0; i < length; ++i) {
sum |= data[i];
}
return (sum == 0);
}

测试 E:lulz。由 Steve Jessop 提议。

BOOL lulz (unsigned char *data, size_t length) {
if (length == 0) return 1;
if (*data) return 0;
return memcmp(data, data+1, length-1) == 0;
}

测试 F:NSData。这是一个使用 NSData 对象的测试,我在处理所有这些时在 iOS SDK 中发现了它。事实证明,Apple 确实知道如何比较设计为独立于硬件的字节流。

- (BOOL)nsdTestData: (NSData *)nsdData length: (NSUInteger)length {
void *tester = (void *)calloc(sizeof(void), (unsigned long)length);
NSData *nsdTester = [NSData dataWithBytesNoCopy:tester length:(NSUInteger)length freeWhenDone:NO];
int test = [nsdData isEqualToData:nsdTester];
free(tester);
return (test);
}

结果

那么这些方法如何比较呢?这里有两组数据,每组代表 5000 次检查循环。首先,我在相对较旧的 iMac 上运行的 iPhone 模拟器上进行了尝试,然后在第一代 iPad 上进行了尝试。

在 iMac 上运行的 iPhone 4.3 模拟器上:

// Test A, nullToLength:  0.727 seconds
// Test F, NSData: 0.727
// Test E, lulz: 0.735
// Test C, is_all_zero: 7.340
// Test B, allZero: 8.736
// Test D, sumArray: 13.995

在第一代 iPad 上:

// Test A, nullToLength: 21.770 seconds
// Test F, NSData: 22.184
// Test E, lulz: 26.036
// Test C, is_all_zero: 54.747
// Test B, allZero: 63.185
// Test D, sumArray: 84.014

这只是两个示例,我进行了多次测试,结果略有不同。性能顺序始终相同:A 和 F 非常接近,E 紧随其后,C、B 和 D。我会说 A、F 和 E 是虚拟纽带,在 iOS 上我更喜欢 F,因为它利用 Apple 对处理器更改问题的保护,但 A & E 非常接近。 memcmp 方法明显优于简单循环方法,在模拟器中快了近十倍,在设备本身上快了两倍。奇怪的是,另一个线程的获胜答案D在这次测试中表现很差,可能是因为它在遇到第一个差异时没有跳出循环。

最佳答案

我认为你应该用一个明确的循环来做,但只是为了 lulz:

if (length == 0) return 1;
if (*pdata) return 0;
return memcmp(pdata, pdata+1, length-1) == 0;

memcpy 不同,memcmp 不要求两个数据部分不重叠。

不过,它可能比循环慢,因为输入指针的未对齐意味着 memcmp 的实现可能无法优化,而且它正在比较内存用内存而不是内存用常数。很容易对其进行剖析并找出答案。

关于objective-c - 确保内存区域为空白(全部为 NULL)的最快方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6544177/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com