- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用一个开源jar(Mate Parser),它在依赖项解析后以 CoNLL 2009 格式输出。我想使用依赖解析结果进行信息提取,但是我只理解CoNLL数据格式的部分输出。
有人可以解释一下 CoNLL 数据格式吗?
最佳答案
有很多不同的CoNLL格式,因为 CoNLL 每年都是不同的共享任务。 CoNLL 2009 的格式描述为 here 。每行代表一个单词以及一系列制表符分隔的字段。 _
表示空值。 Mate-Parser's manual说它使用 CoNLL 2009 的前 12 列:
ID FORM LEMMA PLEMMA POS PPOS FEAT PFEAT HEAD PHEAD DEPREL PDEPREL
其中一些列的定义来自早期的共享任务(2006 年和 2007 年使用的 CoNLL-X format):
ID
(句子中的索引,从 1 开始)FORM
(单词形式本身)LEMMA
(单词的引理或词干)POS
(词性)FEAT
(形态特征列表,以 | 分隔)HEAD
(语法父索引,0 表示 ROOT
)DEPREL
(HEAD
与该单词之间的语法关系)这些列有一些以 P
开头的变体(例如 PPOS
但不是 POS
),表明该值是自动预测的,而不是黄金标准值。
更新:现在有一个CoNLL-U数据格式也扩展了 CoNLL-X 格式。
关于nlp - CoNLL 数据格式是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27416164/
我正在使用一个开源jar(Mate Parser),它在依赖项解析后以 CoNLL 2009 格式输出。我想使用依赖解析结果进行信息提取,但是我只理解CoNLL数据格式的部分输出。 有人可以解释一下
我正在尝试将麦芽解析器与预制的英文模型一起使用。但是,我不知道如何将英语句子的文本语料库转换为 Malt Parser 操作所需的 CoNLL 格式。我在网站上找不到任何文档。我应该怎么做? 更新。我
我想使用斯坦福解析器创建一个 .conll 文件以进行进一步处理。到目前为止,我设法使用以下命令解析测试句子: stanford-parser-full-2013-06-20/lexparser.sh
我想我需要 edu.stanford.nlp 包中的 Semgrex。对于这个任务,我需要从 edu.stanford.nlp.trees.Tree 构建树并像 import edu.stanford
我有一个手动注释的数据集,其中包含以下格式的记录: { "id": 1, "text": "At the end of each fiscal quarter, for the fou
我有一个 CoNLL-X 格式树库和每个句子对应的二叉解析树,我想将它转换成 PTB 格式。是否有任何转换器或任何人都可以阐明 PTB 格式? 最佳答案 为了将依赖关系(以 CoNLL-X 格式表示)
from pyconll import load_from_file data = load_from_file("filename.conll") data 我正在关注 the documentat
我有一些从 CoreNLP 以 .conll 格式输出的文件,我想将它们反序列化为 Annotation 对象。 CoreNLP 是否提供 CONLL-X DocumentReader 方法将 .co
我已经下载了 Conll 2003 语料库(“eng.train”)。我想用它来使用 python crfsuite 训练来提取实体。但我不知道如何加载这个文件进行训练。 我找到了这个示例,但它不适用
我是一名优秀的程序员,十分优秀!