gpt4 book ai didi

nlp - Java 中的 spaCy 替代方案

转载 作者:行者123 更新时间:2023-12-04 13:42:35 26 4
gpt4 key购买 nike

我目前使用 spaCy 来遍历依赖树,并生成实体。

nlp = get_spacy_model(detect_lang(unicode_text))
doc = nlp(unicode_text)

entities = set()
for sentence in doc.sents:

# traverse tree picking up entities
for token in sentence.subtree:
## pick entitites using some pre-defined rules

entities.discard('')
return entities

spaCy 有什么好的 Java 替代品吗?

我正在寻找生成依赖树的库,就像 spaCy 所做的那样。

编辑:

我查看了斯坦福解析器。但是,它生成了以下解析树:
                     ROOT
|
NP
_______________|_________
| NP
| _________|___
| | PP
| | ________|___
NP NP | NP
____|__________ | | _______|____
DT JJ JJ NN NNS IN DT JJ NN
| | | | | | | | |
the quick brown fox jumps over the lazy dog

但是,我正在寻找像 spaCy 这样的树结构:
                             jumps_VBZ
__________________________|___________________
| | | | | over_IN
| | | | | |
| | | | | dog_NN
| | | | | _______|_______
The_DT quick_JJ brown_JJ fox_NN ._. the_DT lazy_JJ

最佳答案

您正在寻找 Stanford Dependency Parser .像大多数斯坦福工具一样,这也与 Stanford CoreNLP 捆绑在一起。下depparse注释者。其他解析器包括 Malt parser (一个基于特征的 shift reduce 解析器)和 Ryan McDonald's MST parser (准确但速度较慢的最大生成树解析器)。

关于nlp - Java 中的 spaCy 替代方案,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41196081/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com