- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有来自 OpenNLP 的 POS 标记输入...我需要将这些与 WordNet 一起使用...但 wordnet 仅使用 4 个标签 - 名词、动词、形容词、副词...其中 OpenNLP 根据 Penn treebank tagset 生成标签.我需要将它们转换为与 wordnet 兼容的标签...我确实找到了 this 在网站上 - 但它都是 python..我需要 java
同意我可以自己编写一个简单的函数来重命名这些标签..但是如何处理其他标签,如 DT、PP、PDT、POS、MD 等...
最佳答案
有关您想对 WordNet 关联执行的操作的更多信息可能会有所帮助,但我的第一个猜测是您想要丢弃未完全映射到 WordNet 类别的词性。
例如,考虑 DT(限定符)。您是否希望从 WordNet 中获得“the”和“an”之间的关系?同样,对于 PP(介词),WordNet 中可能存在有用的关系,但我怀疑您更有可能在不同名词或动词之间找到有用的关系,而不是在封闭类单词之间找到有用的关系。
我的建议是首先将每个 TreeBank 词性标记映射到一个 WordNet 类,或者为那些没有明显映射的词性标记“空”(您可能在某处找到这样的映射,但只有 36 个标签,你自己做起来可能同样容易)。
对于封闭类词,您可能决定使用其他关系元数据源,但这可能取决于您应用程序的最终目标。
关于java - 从 treebank 标签转换为 Java 中的 wordnet 兼容标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5707856/
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 8年前关闭。 Improve thi
我正在寻找处理 Penn Treebank 结构的 Python 数据结构。这是 Treebank 的样例: ( (S (NP-SBJ (PRP He) ) (VP (VBD shou
说我有一句话: After he had eaten the cheese, Bill went to the grocery. 在我的程序中,我得到以下输出: ---PARSE TREE--- (R
我已经下载了 UPDT波斯语树库( Uppsala Persian Dependency Treebank ),我正在尝试使用斯坦福 NLP 从中构建依赖解析器模型。我尝试使用命令行和 Java 代码
我最初使用的是来自 NLTK 的以下 Penn Treebank 标记器: POS_Tagger = UnigramTagger(treebank.tagged_sents(), backoff=De
我正在专门寻找一些数据结构、枚举或生成过程,通过它们在内部表示不同的词性。我花了很长时间扫描了一段时间的Javadoc和源代码,找不到我要找的东西。如果可能的话,我想直接访问标签的集合,如果它们存储在
我正在寻找一个端口为 this 的 Perl 模块我基本上可以在其中创建一个对象,调用一个 tokenize() 子例程,传入一堆文本并取回一个标记列表。达到那种效果的东西。如果它不存在我会做,但重新
我知道 Treebank 语料库已经被标记了,但与 Brown 语料库不同,我不知道如何获得标签字典。例如, >>> from nltk.corpus import brown >>> wordcou
Penn Treebank tagset有一个单独的标签 TO对于单词“to”,无论它是用于介词意义(例如 I went to school )还是不定式意义(例如 I want to eat )。从
我有来自 OpenNLP 的 POS 标记输入...我需要将这些与 WordNet 一起使用...但 wordnet 仅使用 4 个标签 - 名词、动词、形容词、副词...其中 OpenNLP 根据
我正在使用 OpenIE来自斯坦福 NLP 库的工具,用于从句子中获取最少的从句。以下是我到目前为止的想法(主要是从他们的演示代码中获得灵感): public static void main(Str
我正在努力学习使用 NLTK在 python 中打包。特别是,我需要在 NLTK 中使用 penn tree bank 数据集。据我所知,如果我调用 nltk.download('treebank')
我对 NLTK 和 Python 还很陌生。我一直在使用示例中给出的玩具语法创建句子解析,但我想知道是否有可能使用从 Penn Treebank 的一部分学习的语法,而不是仅仅编写我自己的或使用玩具语
我是一名优秀的程序员,十分优秀!