gpt4 book ai didi

tags - OpenNLP 的德国 maxent 模型中使用了哪些标签集?

转载 作者:行者123 更新时间:2023-12-04 03:02:33 24 4
gpt4 key购买 nike

目前我正在使用 OpenNLP 工具对德语句子进行 PoS 标记,maxent 模型列在他们的 download-site 中。 :

在老虎语料库上训练的 de POS Tagger Maxent 模型。 de-pos-maxent.bin

这很有效,我得到的结果如下:

Diese, Community, bietet, Teilnehmern, der, Veranstaltungen, die, Möglichkeit ...
PDAT、FM、VVFIN、NN、ART、NN、ART、NN ...

对于标记的句子,我想做一些进一步的处理,我必须知道单个标记的含义。不幸在搜索 OpenNLP-Wiki对于标签集不是很有帮助,因为它说:

TODO:添加更多标签集,也适用于非英语语言

有谁知道在哪里可以找到德国maxent模型中使用的标签集?

最佳答案

我创建了一个包含德语标签的枚举(可以进行反向查找):

public enum POSGermanTag {

ADJA("Attributives Adjektiv"),
ADJD("Adverbiales oder prädikatives Adjektiv"),
ADV("Adverb"),
APPR("Präposition; Zirkumposition links"),
APPRART("Präposition mit Artikel"),
APPO("Postposition"),
APZR("Zirkumposition rechts"),
ART("Bestimmer oder unbestimmer Artikel"),
CARD("Kardinalzahl"),
FM("Fremdsprachichles Material"),
ITJ("Interjektion"),
KOUI("unterordnende Konjunktion mit zu und Infinitiv"),
KOUS("unterordnende Konjunktion mit Satz"),
KON("nebenordnende Konjunktion"),
KOKOM("Vergleichskonjunktion"),
NN("normales Nomen"),
NE("Eigennamen"),
PDS("substituierendes Demonstrativpronomen"),
PDAT("attribuierendes Demonstrativpronomen"),
PIS("substituierendes Indefinitpronomen"),
PIAT("attribuierendes Indefinitpronomen ohne Determiner"),
PIDAT("attribuierendes Indefinitpronomen mit Determiner"),
PPER("irreflexives Personalpronomen"),
PPOSS("substituierendes Possessivpronomen"),
PPOSAT("attribuierendes Possessivpronomen"),
PRELS("substituierendes Relativpronomen"),
PRELAT("attribuierendes Relativpronomen"),
PRF("reflexives Personalpronomen"),
PWS("substituierendes Interrogativpronomen"),
PWAT("attribuierendes Interrogativpronomen"),
PWAV("adverbiales Interrogativ- oder Relativpronomen"),
PAV("Pronominaladverb"),
PTKZU("zu vor Infinitiv"),
PTKNEG("Negationspartike"),
PTKVZ("abgetrennter Verbzusatz"),
PTKANT("Antwortpartikel"),
PTKA("Partikel bei Adjektiv oder Adverb"),
TRUNC("Kompositions-Erstglied"),
VVFIN("finites Verb, voll"),
VVIMP("Imperativ, voll"),
VVINF("Infinitiv"),
VVIZU("Infinitiv mit zu"),
VVPP("Partizip Perfekt"),
VAFIN("finites Verb, aux"),
VAIMP("Imperativ, aux"),
VAINF("Infinitiv, aux"),
VAPP("Partizip Perfekt"),
VMFIN("finites Verb, modal"),
VMINF("Infinitiv, modal"),
VMPP("Partizip Perfekt, modal"),
XY("Nichtwort, Sonderzeichen"),
UNDEFINED("Nicht definiert, zb. Satzzeichen");

private final String desc;

private static final Map<String, POSGermanTag> nameToValueMap = new HashMap<String, POSGermanTag>();

static {
for (POSGermanTag value : EnumSet.allOf(POSGermanTag.class)) {
nameToValueMap.put(value.name(), value);
}
}

public static POSGermanTag forName(String name) {
return nameToValueMap.get(name);
}

private POSGermanTag(String desc) {
this.desc = desc;
}

public String getDesc() {
return this.desc;
}
}

关于tags - OpenNLP 的德国 maxent 模型中使用了哪些标签集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4570751/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com