- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
表示形容词 POS 的 JJ 标签的词源是什么?我无法在网上找到任何引用资料。有多个资源列出了所有标签,但没有一个资源描述了原因。
最佳答案
可能无法得到官方答复。 JJ
已 used since the Brown corpus ,并且在可追溯到 at least 1981 的出版物中不加评论地出现。 (就在 1979 年 Form C“修订和扩大”版出版之后)。
根据这个record of the corpus ,表格 C 随附的作者的主要出版物是 manual, available here 。它包含该列表,其中有大量关于如何分类单词的解释,但没有解释如何制作标签。
审核后Role of the Brown Corpus in the History of Corpus Linguistics (Olga Kholkovskaia, 2017) ,我同意作者普遍关注的是海量的编译和标注方法而不是评论。 1967年的经典著作《当今美式英语的计算分析》主要是频率表,其中没有“形容词”或JJ
的实例。 因此,我没有找到主要作者 Wilson 和 Kucera 讨论他们对标签选择的出版物,他们都已于 2000 年代去世。
这限制了我们的猜测。作者有 82 个标签,这些标签需要简短、易记(标签过程部分是手动的),并允许附加各种修饰符而不会造成困惑。元音对此毫无用处,表中的每个词性都至少包含一个。动词 (VB
) 和名词 (NN
) 使用第一个和最后一个字母,而其他的则可能使用首字母缩写(并列连词 CC
、外国语单词FW
),音节首字母(模态MD
,预定词PDT
),首字母(所有格POS
),任意关联(感叹词 UH
)。
形容词的 JJ
在使用短语中缺少的字母时很奇怪,并且不像 UH
、所有格 P$
那样具有直观意义,或复数 S
- 但这并不是最奇怪的标签选择,即使在 reduced Penn Treebank table 中也是如此。 。也许有人想匹配 NN
的风格,并将形容词中第一个相对不常见的字母加倍。任何更详细的答案可能只能通过找到未发表的笔记或仍然活着的同事来实现。
关于nlp - 为什么形容词的词性标签是 'JJ' ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56161468/
有没有办法获得形容词的比较级/最高级的肯定形式?例如。更好->好;最大 -> 大。我使用最新版本的 NLTK。 最佳答案 我遇到了同样的问题,在网上搜索没有答案,然后发现实际上可以用 WordNet
我已经看到,对于动词,NLTK 中的 WordNet 相似性度量有时会返回“无”,但我明白这不应该发生在其他词性上。查看代码似乎很清楚,任何其他词类中的两个词对之间没有关系应该产生-1,而不是“无”。
是否可以使用 R 包 openNLP 提取 noun+noun 或 (adj|noun)+noun?也就是说,我想使用语言过滤来提取候选名词短语。你能指导我该怎么做吗?非常感谢。 感谢您的回复。这是代
是否可以使用 NLTK 的 Java 替代品来“验证”单词,正如在这个问题中看到的那样? Convert words between verb/noun/adjective forms 例如我想将 b
我是一名优秀的程序员,十分优秀!