gpt4 book ai didi

python - 依赖关系解析(括号格式) - 西类牙语 - 使用 nltk 和 stanford-nlp 标签

转载 作者:太空宇宙 更新时间:2023-11-03 21:38:53 25 4
gpt4 key购买 nike

我正在尝试解析西类牙语的纯文本语料库以获得类似 SNLI 语料库(用于蕴含)的结果,我在下面附上了 snli 语料库的摘录。

教堂的天花板有裂缝。((教堂)(((天花板)有(裂缝))))。))(ROOT(S(NP(DT中)(NN堂)))(VP(VBZ已)(NP(NP(NNS裂缝)))(PP(IN中)(NP(DT中)(NN吊顶))))) (. .)))

我尝试了以下代码,但输出根本不好。

from nltk import Tree
from functools import reduce
from nltk.parse.corenlp import CoreNLPParser

def binarize(tree):
"""
Recursively turn a tree into a binary tree.
"""
if isinstance(tree, str):
return tree
elif len(tree) == 1:
return binarize(tree[0])
else:
label = tree.label()
return reduce(lambda x, y: Tree(label, (binarize(x), binarize(y))), tree)

parser = CoreNLPParser(url='http://localhost:9002')
#parse, = parser.raw_parse('you could say that they regularly catch a shower, which adds to their exhilaration and joie de vivre')
parse, = parser.raw_parse('si idioma no es elegido entonces elegir español por defecto.')
print(parse)
t = parse
bt = binarize(t)
print(bt)

最佳答案

我的输出是使用 stanford-spanish-corenlp-2017-06-09-models.jar 生成的,可以在此处下载:https://nlp.stanford.edu/software/lex-parser.shtml#Download

出于某种原因,使用较新版本的 models.jar 文件会产生不同的结果。

确保将西类牙语.jar与Stanford Core NLP的其余部分一起放入文件夹中(我使用了最新的2018-10-05)。

然后,当您启动斯坦福核心 NLP 服务器时,请确保以西类牙语启动它:

 java -mx3g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -serverProperties StanfordCoreNLP-spanish.properties -port 9000 -timeout 15000

请注意,CoreNLPTagger 的西类牙语实例使用不同的标签集,详细信息请参见 Spanish FAQ页。

from nltk.parse.corenlp import CoreNLPParser

parser = CoreNLPParser(url='http://localhost:9000')

parsed = parser.raw_parse('si idioma no es elegido entonces elegir español por defecto.')

for node in parsed:
print(node)

下面的示例输出:

(ROOT
(sentence
(S
(S
(conj (cs si))
(sn (grup.nom (nc0s000 idioma)))
(neg (rn no))
(grup.verb (vsip000 es)))
(S (participi (aq0000 elegido))))
(S
(sadv (grup.adv (rg entonces)))
(S
(infinitiu (vmn0000 elegir))
(s.a (grup.a (aq0000 español)))
(sp (prep (sp000 por)) (sn (grup.nom (nc0s000 defecto))))))
(fp .)))

关于python - 依赖关系解析(括号格式) - 西类牙语 - 使用 nltk 和 stanford-nlp 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53047808/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com