- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我刚开始使用 NSLinguisticTagger
,我的代码基于这个博客:NSLinguisticTagger @ NSHipster.com
NSLinguisticTaggerOptions options = NSLinguisticTaggerOmitWhitespace | NSLinguisticTaggerOmitPunctuation | NSLinguisticTaggerJoinNames;
NSLinguisticTagger *tagger = [[NSLinguisticTagger alloc] initWithTagSchemes: [NSLinguisticTagger availableTagSchemesForLanguage:@"en"] options:options];
tagger.string = question;
[tagger enumerateTagsInRange:NSMakeRange(0, [question length]) scheme:NSLinguisticTagSchemeNameTypeOrLexicalClass options:options usingBlock:^(NSString *tag, NSRange tokenRange, NSRange sentenceRange, BOOL *stop) {
NSString *token = [question substringWithRange:tokenRange];
NSLog(@"%@: %@", token, tag); }];
当我使用 question = @"Weekend in New York"
运行它时,"New York"
被标记为 PlaceName
,这很棒.但是当我使用 question = @"Weekend in new york"
运行它时,"new"
被标记为 "Adjective"
和 “york”
被标记为 PlaceName
。有没有办法解决这个问题,让 "New York"
和 "new york"
都被标记为 PlaceName
?
我对语言学这个东西完全陌生。
最佳答案
让这个话题更进一步。 名字和姓氏的正确大写是 NSLinguisticTagger 识别名字的要求。
经过几个小时的挫折,我决定创建各种包含大写、小写和大写单词的测试。
NSLinguisticTagger 在几乎所有的测试中都有不同的结果
当 NSLinguisticTagger 解析大写字母的字符串时,几乎所有名词都被标记为 personalName。什么鬼?
这很令人沮丧。
我想分享的教训是,NSLinguistic tagger 可以猜测它给单词加的标签,但最终它只是对单词的语法评估。评估取决于适当的语言结构,例如单词放置以及单词是否大写。
我仍然觉得它是一个有用的类(class),但这篇文章的寓意是“适当”。
在解析文本时,有时我们的程序员倾向于使用大写和小写来简化我们的工作。我们仍然可以这样做,但请记住单词大小写确实会改变 NSLinguisticTagger 结果。
关于ios - objective-C :NSLinguisticTagger "new york"与 "New York",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14938867/
我刚开始使用 NSLinguisticTagger,我的代码基于这个博客:NSLinguisticTagger @ NSHipster.com NSLinguisticTaggerOptions op
对于此代码,我获得了一个包含多个城市的文本文件。我想确定提到的城市并打印他们的州和国家。 要求:如果提到的城市位于两个或多个国家/地区,我会要求用户提及他们正在谈论的城市。此外,如果有轻微的打字错误,
我有三个带有单个text字段的文档。这里是他们的内容: 1) {"text": "I want to match docs with a word New"} 2) {"text": "But I d
Apple 发布了一种新字体,New York ,使用 iOS 13。是否可以在 CSS 中为 Web 内容设置它,例如 using -apple-system for San Francisco ?
我正在尝试使用 python goose extractor 从《纽约时报》中提取文章。 我尝试过使用标准的 url 检索方式: g.extract(url=url) 但是这会产生一个空字符串。所以我
我正在使用 http://example.com/area.jsp?id=1 并且想要创建一个映射路径 http://example.com/newyork 映射到/area.jsp?id=1 我该如
我已遵循 hello world 1 中的所有步骤 https://docs.corda.net/hello-world-template.html https://github.com/corda/
我已遵循 hello world 1 中的所有步骤 https://docs.corda.net/hello-world-template.html https://github.com/corda/
我是一名优秀的程序员,十分优秀!