nlp - CoNLL 数据格式是什么？-6ren

nlp - CoNLL 数据格式是什么？

转载作者：行者123 更新时间：2023-12-02 01:43:49

35

4

我正在使用一个开源jar(Mate Parser)，它在依赖项解析后以 CoNLL 2009 格式输出。我想使用依赖解析结果进行信息提取，但是我只理解CoNLL数据格式的部分输出。

有人可以解释一下 CoNLL 数据格式吗？

最佳答案

有很多不同的CoNLL格式，因为 CoNLL 每年都是不同的共享任务。 CoNLL 2009 的格式描述为 here 。每行代表一个单词以及一系列制表符分隔的字段。 _ 表示空值。 Mate-Parser's manual说它使用 CoNLL 2009 的前 12 列:

ID FORM LEMMA PLEMMA POS PPOS FEAT PFEAT HEAD PHEAD DEPREL PDEPREL

其中一些列的定义来自早期的共享任务(2006 年和 2007 年使用的 CoNLL-X format):

ID(句子中的索引，从 1 开始)
FORM(单词形式本身)
LEMMA(单词的引理或词干)
POS(词性)
FEAT(形态特征列表，以 | 分隔)
HEAD(语法父索引，0 表示 ROOT)
DEPREL(HEAD 与该单词之间的语法关系)

这些列有一些以 P 开头的变体(例如 PPOS 但不是 POS)，表明该值是自动预测的，而不是黄金标准值。

更新:现在有一个CoNLL-U数据格式也扩展了 CoNLL-X 格式。

关于nlp - CoNLL 数据格式是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27416164/

35

4

0

文章推荐： vba - XLAM/XLA 插件 : is there a better way?

文章推荐： groovy - 如何在groovy中屏蔽输入

文章推荐： excel - 如何从 Excel VBA 中的模块调用此工作簿中的方法？

video - AVFrame 数据格式
我处理来自 AVFrame.data 的原始数据。此帧的像素格式为 AV_PIX_FMT_YUV420P。我想了解此数据位于哪个值范围内。似乎 UV(在 YUV 方案中)必须在 [-128, 128
Wii Fit 数据格式？
关闭。这个问题需要更多focused .它目前不接受答案。想改善这个问题吗？更新问题，使其仅关注一个问题 editing this post . 去年关闭。 Improve this questio
GWT RPC 数据格式
Google Web Toolkits (GWT) RPC 调用的数据格式如何以及 IsSerializable 对象如何传输。我知道 Java Serializable 传输某种二进制格式，但是 G
audio - ASIO 数据格式
我打算建立一个简单的音频接口(interface)。为此，我只想知道 ASIO 驱动程序通常以哪种格式将数据传递给程序？我无法从规范中找出这一点，也无法在其他地方找到它。我不想编写自己的驱动程序，我只
audio - 平滑流和AAC低复杂度音频编解码器。数据格式？
我正在编写一个平滑流客户端应用程序。在服务器端(带有Media Services扩展的IIS 7)上，我有一堆ISMV和ISMA文件，这些文件是使用Expression Encoder pro 4预先
java - JSON 数据格式
我使用 JSON.stringify 和 JQuery.ajax() 将以下 JSON 对象从 .jsp 页面传递到 java servlet: {"bin":[{"binId":"0","binDe
xml - 将标签文本转换为 Perl 数据格式
我有一些来自 VLM telnet 服务的数据: show media : ( 1 broadcast - 0 vod ) cam1 type : br
.net - RSACryptoServiceProvider.ExportCspBlob 数据格式
我们正在导出公钥和私钥。私钥将由用 Magic 编写的非 .net 软件使用。开发人员对导出 key 的格式有疑问。是否有白皮书或其他资源来解释导出数据的格式？最佳答案关于导出的 blob 类型的
python - Altair 中的多线图 - 数据格式？
如何在 Altair 中创建多线图？特别是，我有一个 pandas 数据框，如下所示: Commit Author Date Week Adds
javascript - D3 数据格式，如可缩放的旭日图
我的数据格式类似于此示例中使用的 flare.json: 我只是想知道 d3 可缩放图表使用什么函数来获取这种格式的数据在 flare.json 中是这样的 { name: "stuff",
javascript - 不正确的 JSON 数据格式
我正在尝试创建一些 JSON 用于使用 Highcharts 显示图表 http://www.highcharts.com/ 我复制了他们的一个例子: http://www.highcharts.co
c++ - 读取 BSDF 数据格式
我被要求编写一个读取 BSDF data format defined by Zemax 的函数此类文件的示例可在以下页面找到:BSDF file example 如果可能的话，我想只使用标准的 if
swift - 如何更改 CVPixelBuffer 数据格式
我为 CoreML 将 UIImage 转换为 CVPixelBuffer，但我想更改 RGB 像素，如 R/1.5、G/2、B/2.5。我可以使用assumingMemoryBound(to :
javascript - 树布局 - 链接 - 数据格式
我正在开发一个项目，我想展示网站中的各种文件如何相互交互。我认为使用 D3 这将是一个相当简单的任务，但现在我想知道我的 json 数据是如何排列的。这是我的数据示例: { "pages" : [{
java - Apache POI 数据格式
我正在使用 Apache POI 构建一些 Excel 文件，我想确保某些单元格的类型为“Number”。我尝试了以下方法: style.setDataFormat(HSSFDataForm
c# - 抽象 UI 数据格式
我有一些具有小数属性的实体。这些实体的属性显示在我整个 UI 的多个位置。目前我发现自己在做: litWeight.Text = person.Weight.ToString("0.00"); 无处
把实体转为json 数据格式---jackson 的详细用法_Jackson快速入门
首先介绍三个注解： @JsonAutoDetect (method/field):作用于方法或字段，用来表明，当生成json的时候忽略有该annotation的方法或字段 @JsonIgnore 过滤
Syslog 中的 Azure SIEM 数据格式
我是 Azure 的新手，一直在使用 Azure Monitor 和 AZ Sentinel 进行日志记录和分析部分。我的审核日志从 AZ VM 中托管的第三方供应商安全设备流向 Syslog VM。
java - XLSX 的 CellStyle 数据格式
我有一些代码，例如: CellStyle cs2 = wb.createCellStyle(); CellStyle cs4 = wb.createCellStyle(); cs4.setDataFo
java - YourKit 导出 CSV 数据格式
我正在尝试提取 YourKit 的“线程” View 中显示的数据(关于线程状态；主要是当每个线程“等待”或“可运行”时)。我已使用命令行导出实用程序为其支持的所有 View 生成所有格式。导出目录

首页

博学

6Ren·AI

商城

nlp - CoNLL 数据格式是什么？