nlp - 用于词性标注器的 Baum-Welch 算法-6ren

nlp - 用于词性标注器的 Baum-Welch 算法

转载作者：行者123 更新时间：2023-11-30 08:34:26

25

4

大家。我正在使用 Baum-Welch 算法来训练词性标注器，它完全是无监督的方式。问题来了:当我得到标签结果时，我只得到一个数字序列。我不知道哪个标签代表 VV、NN、DT。我该如何解决这个问题？

最佳答案

一般来说，没有办法做到这一点。鲍姆-韦尔奇将找到具有相似分布的单词使用类别，但没有特别的理由假设这些类别将以任何直接的方式映射到任何特定语言理论所提出的类别。因此，无监督词性标注器主要适用于您关心单词或短语的等价类但不关心分配的特定标签的应用程序。

如果您确实需要人类可读的标签(例如，在开发过程中，评估您得到的结果是否合理)，我会手动标记几十个句子。然后，您可以将 B-W 派生标注器应用于已标记的迷你语料库，以诱导类编号和 POS 标签之间的映射。

关于nlp - 用于词性标注器的 Baum-Welch 算法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5217170/

25

4

0

文章推荐： javascript - nodeJS语法错误: unexpected token this

文章推荐： javascript - 如何在javascript中执行系统命令？

nlp - 词性 (POS) 与句法依赖解析
我正在使用 SpaCy 进行文本分析，但我无法理解词性 (POS) 和句法依赖分析之间的区别。两者都根据单词的作用在句子中标记单词。但它们究竟有何不同？最佳答案我们使用词性标注来标记句子中的标记，
nlp - 词性 (POS) 与句法依赖解析
我正在使用 SpaCy 进行文本分析，但我无法理解词性 (POS) 和句法依赖分析之间的区别。两者都根据单词的作用在句子中标记单词。但它们究竟有何不同？最佳答案我们使用词性标注来标记句子中的标记，
java - 在Java中使用POSTagger将不同的POS(词性)保存在不同的文件中？
我正在使用 openNLP 来标记 POS(词性)。 InputStream inputStream = new FileInputStream("C:/en-pos-max
python - 如何在 NLTK 词性 (POS) 标记中只获取所选标记的词？
抱歉，我是 Pandas 和 NLTK 的新手。我正在尝试构建一组自定义返回的 POS。我的数据内容: comment 0 [(have, VERB), (you, PRO
java - 交互式 NLP 词性 (POS) 标记 - 强制某些术语成为特定标记
我正在尝试执行词性标记，并且我对任何基于 Java 的标记器持开放态度(当前使用 OpenNLP)。有没有办法“强制”标记器将特定术语(或单词组合)识别为特定标签，并据此对其他术语进行分类？有点允许标
python:如何在 scikit 学习分类器 (SVM) 等中使用 POS(词性)特征
我想将 nltk.pos_tag 返回的词性 (POS) 用于 sklearn 分类器，如何将它们转换为向量并使用它？例如 sent = "这是 POS 示例" tok=nltk.tokenize.w

首页

博学

6Ren·AI

商城

nlp - 用于词性标注器的 Baum-Welch 算法