- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试将CFStringTokenizer与kCFStringTokenizerUnitSentence结合使用,以将字符串拆分为句子。我遇到的第一个问题是,句子必须大写才能被识别为句子。如果不是,它只是认为这是前一句话的一部分。
我正在分割用户输入的文本,因此我希望文本非常不干净。
我还能使用CFStringTokenizer进行其他操作以使其检测未大写的句子吗?还是我必须使用另一种完全拆分的方法?
我按照这个SO问题的答案进行了实施:
How to get an array of sentences using CFStringTokenizer?
注意:经过更多测试后,似乎使用kCFStringTokenizerUnitSentence,如果出现“!”还是一个“?”后面跟着一个不大写的句子,它将识别该句子。同样,如果这些标点符号之一后接一个句子,且“!”之间没有空格和第一个单词,它将仍然分开。
因此,我需要解决的一个情况是“。”。其次是没有大写字母的句子。
我发现的另一个选择是,如果您要从textField获取文本,请使用以下方法:
textField.autocapitalizationType = UITextAutocapitalizationTypeSentences;
最佳答案
您可以先将输入字符串转换为所有大写字母,然后通过CFStringTokenizer
运行它,并使用范围获取原始输入字符串的子字符串。但是您在这里必须小心,因为转换为大写字母后,某些字符可能会超过1个字符。
关于ios - CFStringTokenizer不标记小写句子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15673931/
我创建了一个像这样的字符串标记器: stringTokenizer = CFStringTokenizerCreate( NULL
我只是在学习 Swift 并尝试使用 CFStringTokenizer,我注意到当字符串被标记化时,标点符号和符号会被忽略。我不太熟悉标记化的主题,但如果我需要进行更复杂的标记化,需要我找到诸如“!
我正在使用代码 here将文本拆分为单个单词,它适用于我尝试过的所有语言,但日语和中文除外。 有没有一种方法可以调整代码以正确标记日文和中文?文档说支持这些语言,但它似乎并没有在适当的地方打断单词。例
我正在使用 CFStringTokenizer 将大量文本分解为单词,但我很难桥接 CFString 使用的任何编码和 UTF8。考虑一下: NSString *theString = @"Lorem
CFStringTokenizer 文档在 CFStringTokenizerAdvanceToNextToken() 中有两个相互冲突的语句: CFStringTokenizerAdvanceToN
我是一名优秀的程序员,十分优秀!