gpt4 book ai didi

nlp - 斯坦福 NNDep 解析器 : features used

转载 作者:行者123 更新时间:2023-12-04 20:40:38 25 4
gpt4 key购买 nike

关于斯坦福的神经网络依赖解析器 在训练和测试阶段使用了哪些特征?实际上,CONLL 中的哪些列ˣ格式化的数据集可以用 _ 代替,而解析器在训练时不会失去任何准确性?哪些列从未被阅读?

当然是 IDFORMHEAD(第 # 12 列& 7) 是必须的,因为很可能是 U/C-POSTAG (# 4) 和 DEPREL (#8)。但是 LEMMA(X)-POSTAGFEATS 列(# 35 & 6)?它们在训练时有帮助吗,或者树库中是否包含与解析器无关的任何信息?

最佳答案

在当前的实现中,我们只使用以下字段。我的列索引从 1 开始。

  • FORM(第 2 列)
  • UPOSTAG(第 4 列)[^1]
  • HEAD(第 7 列)
  • DEPREL(第 8 列)

[^1]:如果使用粗略的词性标记 (-cPOS) 进行解析,我们改为阅读第 5 列。

只要您不破坏 CoNLL 格式(即,仍然在空列中包含 _),其他所有内容都可以为空。

请查看我们在这里阅读了哪些专栏:edu.stanford.nlp.parser.nndep.Util.loadConllFile .请注意,这些对于 CoNLL-X 和 CoNLL-U 表示都是相同的。

关于nlp - 斯坦福 NNDep 解析器 : features used,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33787955/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com