gpt4 book ai didi

parsing - 如何获得粗粒度的词性标签?

转载 作者:行者123 更新时间:2023-12-04 02:23:52 25 4
gpt4 key购买 nike

我有一个由柯林斯解析器注释的数据集。现在,我将数据集中每个单词的 POS 作为一个特征。问题是我不需要细粒度的 POS。所以,我结合了一些标签。例如,我假设“动词”类别下的所有 VBD、VBP、VBZ、VBG。对于名词,我假设 NNP 和 NNS 为“名词”类别。

所以,这是我在完成所有组合后拥有的 POS 标签列表:

VB, NN, TO, JJ, IN, EX, RB, WP, PRP, MD, UH, WRB, WDT, RP, CD, POS, DT, PRP$, WP$, CC, RBR



现在,我的问题是在哪里可以找到粗粒度的 POS 标签列表?是否有任何标准的粗粒度 POS 标签列表?

在我的系统中,如果我不结合其他 POS 标签,我可以获得更好的结果。我想知道是否允许我保留当前的列表?还是我也应该将它们结合起来?

提前致谢,

最佳答案

您可以使用 Petrov 的通用标签集。通用标签集有12个,极大地提高了词性标注效率。您可以引用 Universal POS tagset 您也可以在 POS mapping 下载一些标记器的代码和映射

关于parsing - 如何获得粗粒度的词性标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24990527/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com