objective-c - 遍历 NSString 中所有字符的最有效方法-6ren

objective-c - 遍历 NSString 中所有字符的最有效方法

转载作者：IT老高更新时间：2023-10-28 11:34:24

38

4

遍历 NSString 中所有字符的最佳方法是什么？是否要循环遍历字符串的长度并使用该方法。

[aNSString characterAtIndex:index];

或者您想使用基于 NSString 的字符缓冲区？

最佳答案

我认为人们了解如何处理 unicode 很重要，所以我最终写了一个怪物答案，但本着 tl;dr 的精神，我将从一个应该可以正常工作的片段开始.如果你想知道细节(你应该知道!)，请在片段之后继续阅读。

NSUInteger len = [str length];
unichar buffer[len+1];

[str getCharacters:buffer range:NSMakeRange(0, len)];

NSLog(@"getCharacters:range: with unichar buffer");
for(int i = 0; i < len; i++) {
  NSLog(@"%C", buffer[i]);
}

还和我在一起吗？好!

当前接受的答案似乎将字节与字符/字母混淆。这是遇到 unicode 时的常见问题，尤其是来自 C 背景的情况。 Objective-C 中的字符串表示为 unicode 字符 (unichar)，它比字节大得多，不应该与标准 C 字符串操作函数一起使用。

(编辑:这还不是全部内容!令我感到非常遗憾的是，我完全忘记了考虑可组合字符，其中一个“字母”由多个 unicode 组成代码点。这为您提供了一种情况，您可以将一个“字母”解析为多个 unichars，而每个 unichars 又是多个字节。哎呀。有关详细信息，请参阅 this great answer。)

问题的正确答案取决于您是要遍历 characters/letters(不同于类型 char)还是 bytes 字符串(类型 char 的实际含义)。本着避免混淆的精神，从现在开始，我将使用术语 byte 和 letter，避免使用可能有歧义的术语 character。

如果你想做前者并遍历字符串中的字母，你需要专门处理 unichars(对不起，但我们现在在未来，你不能再忽略它了)。查找字母的数量很容易，这是字符串的长度属性。一个示例片段是这样的(与上面相同):

NSUInteger len = [str length];
unichar buffer[len+1];

[str getCharacters:buffer range:NSMakeRange(0, len)];

NSLog(@"getCharacters:range: with unichar buffer");
for(int i = 0; i < len; i++) {
  NSLog(@"%C", buffer[i]);
}

另一方面，如果您想遍历字符串中的字节，它开始变得复杂，结果将完全取决于您选择使用的编码。不错的默认选择是 UTF8，所以这就是我要展示的内容。

这样做你必须弄清楚生成的 UTF8 字符串有多少字节，这是一个容易出错的步骤并使用字符串的 -length。这很容易出错的一个主要原因，尤其是对于美国开发人员而言，是具有 7 位 ASCII 范围内的字母的字符串将具有相等的字节和字母长度。这是因为 UTF8 用一个字节编码 7 位 ASCII 字母，所以一个简单的测试字符串和基本的英文文本可能工作得很好。

正确的方法是使用 -lengthOfBytesUsingEncoding:NSUTF8StringEncoding 方法(或其他编码)，分配具有该长度的缓冲区，然后将字符串转换为与 -cStringUsingEncoding: 相同的编码并将其复制到该缓冲区中。示例代码:

NSUInteger byteLength = [str lengthOfBytesUsingEncoding:NSUTF8StringEncoding];
char proper_c_buffer[byteLength+1];
strncpy(proper_c_buffer, [str cStringUsingEncoding:NSUTF8StringEncoding], byteLength);

NSLog(@"strncpy with proper length");
for(int i = 0; i < byteLength; i++) {
  NSLog(@"%c", proper_c_buffer[i]);
}

为了让大家明白为什么保持直截了当很重要，我将展示以四种不同方式处理此迭代的示例代码，其中两种是错误的，两种是正确的。这是代码:

#import <Foundation/Foundation.h>

int main() {
  NSString *str = @"буква";
  NSUInteger len = [str length];

  // Try to store unicode letters in a char array. This will fail horribly
  // because getCharacters:range: takes a unichar array and will probably
  // overflow or do other terrible things. (the compiler will warn you here,
  // but warnings get ignored)
  char c_buffer[len+1];
  [str getCharacters:c_buffer range:NSMakeRange(0, len)];

  NSLog(@"getCharacters:range: with char buffer");
  for(int i = 0; i < len; i++) {
    NSLog(@"Byte %d: %c", i, c_buffer[i]);
  }

  // Copy the UTF string into a char array, but use the amount of letters
  // as the buffer size, which will truncate many non-ASCII strings.
  strncpy(c_buffer, [str UTF8String], len);

  NSLog(@"strncpy with UTF8String");
  for(int i = 0; i < len; i++) {
    NSLog(@"Byte %d: %c", i, c_buffer[i]);
  }

  // Do It Right (tm) for accessing letters by making a unichar buffer with
  // the proper letter length
  unichar buffer[len+1];
  [str getCharacters:buffer range:NSMakeRange(0, len)];

  NSLog(@"getCharacters:range: with unichar buffer");
  for(int i = 0; i < len; i++) {
    NSLog(@"Letter %d: %C", i, buffer[i]);
  }

  // Do It Right (tm) for accessing bytes, by using the proper
  // encoding-handling methods
  NSUInteger byteLength = [str lengthOfBytesUsingEncoding:NSUTF8StringEncoding];
  char proper_c_buffer[byteLength+1];
  const char *utf8_buffer = [str cStringUsingEncoding:NSUTF8StringEncoding];
  // We copy here because the documentation tells us the string can disappear
  // under us and we should copy it. Just to be safe
  strncpy(proper_c_buffer, utf8_buffer, byteLength);

  NSLog(@"strncpy with proper length");
  for(int i = 0; i < byteLength; i++) {
    NSLog(@"Byte %d: %c", i, proper_c_buffer[i]);
  }
  return 0;
}

运行此代码将输出以下内容(去掉 NSLog cruft)，准确显示字节和字母表示的不同之处(最后两个输出):

getCharacters:range: with char buffer
Byte 0: 1
Byte 1: 
Byte 2: C
Byte 3: 
Byte 4: :
strncpy with UTF8String
Byte 0: Ð
Byte 1: ±
Byte 2: Ñ
Byte 3: 
Byte 4: Ð
getCharacters:range: with unichar buffer
Letter 0: б
Letter 1: у
Letter 2: к
Letter 3: в
Letter 4: а
strncpy with proper length
Byte 0: Ð
Byte 1: ±
Byte 2: Ñ
Byte 3: 
Byte 4: Ð
Byte 5: º
Byte 6: Ð
Byte 7: ²
Byte 8: Ð
Byte 9: °

关于objective-c - 遍历 NSString 中所有字符的最有效方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4158646/

38

4

0

文章推荐： ios - NSDate - 将日期转换为 GMT

文章推荐： c++ - uint8_t 不能用 cout 打印

文章推荐： java - 数组是Java中的对象吗？

文章推荐： python - TensorFlow，为什么选择 python 语言？

nsstring - 子类化 NSString
使用 WSDL2ObjC 我得到了很多类，它们是 NSString 的子类。我发现初始化这些类的任何对象的 NSString 值很麻烦。假设我的类(class)是这样的: @interface mC
objective-c - -[NSString stringByAppendingPathComponent :] or just -[NSString stringByAppendingFormat:] for NSStrings for NSURLs?
当调用 +[NSURL URLWithString:] 时，我有两个构建 URL 的选项: [[@"http://example.com" stringByAppendingPathComponent
nsstring - 修剪 NSString 末尾的空格
我需要删除字符串末尾的空格。我怎样才能做到这一点？示例:如果字符串是 "Hello " 它必须变成 "Hello" 最佳答案摘自这里的答案:https://stackoverflow.com/a/5
nsstring - 如何将 NSString 转换为字节
NSString *test = @"ABCDEFGHIJKLMNOPQRSTUVWXYZ"; 如何将此字符串转换为字节？最佳答案 NSData *bytes = [test dataUsingEn
iphone - NSString 变量不是 NSstring
我对 NSString 变量有疑问。 .h 文件 NSString *strDeleteFilePath; @property (nonatomic,retain) NSString*
ios - (NSString *) 它是指针还是 NSString？
我对这个功能有疑问: - (instancetype)initWithCenter:(CLLocationCoordinate2D)center
iphone - NSString *string = @"someString"vs NSString *string = [[NSString alloc] initWithFormat @"%@", string]
如果我有方法 - (void) myMethod:(NSString *)string { [Object anothermethodWithString:string]; } 我打电话 [O
ios - NSString *var = @"value"和 NSString *var =[ [NSString alloc] initWithString : @"value"] 有什么区别
ios 中初始化字符串变量的两种方式有什么区别(，adv/disadv)？ NSString *var = @"value" 和 NSString *var =[ [NSString alloc] i
objective-c - NSString *s = @"string"和 NSString *s = [[NSString alloc] initWithString : @"string"]? 之间有什么区别
我认为这个问题已经足够清楚了，但仍然 - 有什么区别: NSString *string = @"Hello world!"; 和 NSString *string = [[NSString allo
nsstring - 如何将 NSString 转换为 char？
我正在尝试将 NSString 转换为单个字符。当我写 [[NSLocale] currentLocale] objectForKey:NSLocaleDecimalSeparator] 时，我得到
ios - 使用两个 NSString 创建前缀 NSString
我有指示制作一个前缀方法，该方法在每个位置采用两个字符串，其中 mask = 0 并且第一个字符串 = 第二个字符串，直到不满足这些条件为止，即您的前缀 NSString。我做了尝试，但由于某种原因
ios - 将 NSString 转换为其他 NSString
我有 3 个 NSString 和 1 个带值的 NSArray，我尝试将所有字符串转换为一个: string01 = [string01 stringByAppendingString:[numbe
iphone - 从其他 NSString 的某个点创建 NSString
我有一个包含以下文本的 NSString: You can now download "file.png" from "http://www.example.com/RANDOM.png" 如何使用该
ios - 如何在 NSString 中多次出现的特定字符后获取 NSString？
我有一个完整的 URL，比方说 http://www.mywebsite.com//Folder /Detals /Final Image /La Image Logo.jpg 在这个NSString
ios - 从 NSString 中删除重复的单词并另存为新的 NSString
在某些情况下，我可能有一个包含多个单词的 NSString，其中一些是重复的。我想要做的是采用如下所示的字符串: One Two Three Three Three Two Two Two One O
iphone - 删除 NSString 的一部分并将其复制到另一个 NSString
所以我有一个 NSString，让我们说:NSString *mainString = @"My Name is Andrew (I like computers)";我想从 mainString 中
nsstring - 无法快速将 NSData 转换为 NSString
这是我的职责。首先 println 将正确的散列打印到控制台，但在下一行程序崩溃。你能帮助我吗？ func sha256(string: NSString) -> NSString { var
iphone - 使用 NSString 作为 NSString 数组？
我刚刚看到一行由同事编写的代码，我以前从未在 Obj-C 中见过它。它看起来形式很糟糕，我想更改它，但它似乎有效(应用程序按预期工作)，我什至不知道将其更改为什么。 NSString **string
cocoa - 如何获取 nsstring 与其他 nsstring 对象的匹配计数？
我花了很长时间寻找一种获取 nsstring 对象的匹配计数的方法。但我找不到。如何获取 String_one 和 String_Two 的匹配计数？我需要你的帮助.. NSString *Strin
ios - 为什么我的 NSString 不适合使用我的 NSString 宽度创建的框架？
在我看来，我正在处理的代码应该是这样写的: if (!instructions) { instructions = [[UITextView alloc] init]; ins

首页

博学

6Ren·AI

商城

objective-c - 遍历 NSString 中所有字符的最有效方法