gpt4 book ai didi

java - 什么是用于词性标记的好的 Java 库?

转载 作者:IT老高 更新时间:2023-10-28 21:13:02 24 4
gpt4 key购买 nike

我正在寻找一个好的开源 POS Tagger在 java 。这是我到目前为止的想法。

有人推荐吗?

最佳答案

您是否希望在特定域中标记 POS?大多数通用标记器都接受过新闻专线文本的培训。通常,当您在特定领域(如生物医学文本)中使用它们时,它们的表现不佳。还有其他专门为此类域训练的标注器,例如 dTagger (java) 用于生物医学文本。​​

对于新闻专线,Adwait Ratnaparkhi 的 MXPOST非常好,是我推荐的。

其他 Java 实现包括:

  1. MontyLingua
  2. Berkeley Parser (不是真正的 POS 标记器,但所有成熟的解析器通常都会包含 POS 标记器。Google for Java 句法解析器,你会发现很多。)
  3. QTag
  4. LBJ

OpenNLPLingpipe正如其他海报所发布的那样,也相当不错。

可以在 here 上找到关于 POS 标记的最新信息。 .如您所见LTAG-Spinal (另一张海报也提到过)目前排名最高,但各种标注器的差异并不大。我自己没有使用过 LTAG。

另请注意,POS 标记的基准性能约为 90%。基线意味着 - (a) 用词典中最常见的 POS 标签标记每个单词,以及 (b) 将每个未知单词标记为名词。

关于java - 什么是用于词性标记的好的 Java 库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2293636/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com