gpt4 book ai didi

python - CESS_ESP 标签的定义

转载 作者:太空宇宙 更新时间:2023-11-03 15:12:03 28 4
gpt4 key购买 nike

我正在使用 NLTK CESS ESP 数据包,我已经能够使用 adatpation的 spaghetti tagger和一个 HiddenMarkovModelTagger 来标记句子,但它产生的标记与标记 en_US 句子时使用的标记完全不同,这里是 Categorizing and Tagging 的链接NLTK 的文档,您会注意到使用的标签是大写的,没有任何数字或标点符号,一些 cess 标签:vsip3s0da0fs0

有人知道解释这些标签的引用资料吗?

句子

¿Que es la programación orientada a objetos?

意大利面条标记器

[('\xc2\xbfQue', None), ('es', 'vsip3s0'), ('la', 'da0fs0'), ('programaci\xc3\xb3n', None), ('orientada', 'aq0fsp'), ('a', 'sps00'), ('objetos', 'ncmp000'), ('?', 'Fit')]
[('\xc2\xbfQue', None), ('es', None), ('la', None), ('programaci\xc3\xb3n', None), ('orientada', None), ('a', None), ('objetos', None), ('?', None)]
[('\xc2\xbfQue', None), ('es', 'vsip3s0'), ('la', 'da0fs0'), ('programaci\xc3\xb3n', None), ('orientada', 'aq0fsp'), ('a', 'sps00'), ('objetos', 'ncmp000'), ('?', 'Fit')]
[('\xc2\xbfQue', None), ('es', 'vsip3s0'), ('la', 'da0fs0'), ('programaci\xc3\xb3n', None), ('orientada', 'aq0fsp'), ('a', 'sps00'), ('objetos', 'ncmp000'), ('?', 'Fit')]

马尔可夫标注器

[('\xc2\xbfQue', 'sn.e-SUJ'), ('es', 'vsip3s0'), ('la', 'da0fs0'), ('programaci\xc3\xb3n', 'ncfs000'), ('orientada', 'aq0fsp'), ('a', 'sps00'), ('objetos', 'ncmp000'), ('?', 'Fit')]

最佳答案

cess-esp 语料库使用名为 EAGLE 的旧注释系统进行标记,您可以看到它 here .希望这会有所帮助。

关于python - CESS_ESP 标签的定义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25256878/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com