gpt4 book ai didi

python - 如何使用 corenlp 用 python 提取句法特征?

转载 作者:太空宇宙 更新时间:2023-11-04 05:57:54 24 4
gpt4 key购买 nike

我想从一个句子中提取句法信息。我试过的是

corenlp_dir = "/home/corenlp-python/stanford-corenlp-full-2013-11-12/"
parser = corenlp.StanfordCoreNLP(corenlp_path=corenlp_dir)

result_json = json.loads(parser.parse("I am Alice."))
#pprint.pprint(result_json)
for sentence in result_json["sentences"]:
pprint.pprint(sentence["parsetree"])
print type(sentence["parsetree"])

我只得到

--># u'(ROOT (S (NP (PRP I)) (VP (VBP am) (NP (NNP Alice))) (. .)))'
<type 'unicode'>

结果是一个字符串,而不是解析树。然而,我真正想要的是像一个句法特征,可以用来做文本分类。如何从上面的结果中提取特定的句法特征?我不知道该怎么做。谁能帮助我或给我一些建议?

最佳答案

你最好先了解结果的格式,如果你愿意,可以编写自己的代码来演示/绘制结果。

以你的结果为例,一个最小的单位可以是 (PRP I),这意味着“I”在这句话中扮演了“代词”的角色,如果你查看当前括号,(NP (PRP I) ) 表示这个代词是一个名词短语(NP)。 ETC这就是您从下到上获得解析树的方式,最后您将到达“ROOT”。

关于python - 如何使用 corenlp 用 python 提取句法特征?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26754631/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com