- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我一直在试验 Stanford NLP 工具包及其词形还原功能。我很惊讶它如何使一些词词形还原。例如:
depressing -> depressing
depressed -> depressed
depresses -> depress
它无法将 depressing
和 depressed
转换成同一个引理。 Simmilar 发生在 confusing
和 confused
,hopelessly
和 hopeless
上。我感觉它唯一能做的就是删除 s
如果单词是这种形式(例如 feels -> feel
)。这种行为对于英语中的 Lematizatiors 来说是正常的吗?我希望他们能够将这些常用词的变体转化为相同的引理。
如果这是正常的,我应该使用词干分析器吗?而且,有没有办法在 StanfordNLP 中使用像 Porter(Snowball 等)这样的词干分析器?他们的文档中没有提到词干分析器;但是,API 中有一些 CoreAnnotations.StemAnnotation
。如果不能使用 StanfordNLP,您推荐在 Java 中使用哪些词干提取器?
最佳答案
词形还原主要取决于标记的词性。只有具有相同词性的标记才会映射到相同的引理。
在“This is confusing”这句话中,confusing
被解析为形容词,因此词形化为confusing
。相比之下,在句子“I was confusing you with someone else”中,confusing
被分析为动词,并被词形还原为confuse
。
如果您希望将具有不同词性的标记映射到相同的引理,您可以使用词干提取算法,例如 Porter Stemming ,您可以简单地调用每个 token 。
关于java - StanfordNLP 词形还原无法处理 -ing 词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30210494/
基本上,在句子中: is a fantasy movie. 我想检测化合物Lord of the bracelets作为一个实体(也可以在实体链接注释器中链接)。这意味着检测具有类似 NNP 形式的
我刚刚安装了 python stanford nlp,运行良好:- pip 安装 stanfordnlp 我在 python shell 中尝试实例化包,但出现以下错误:- >>> import st
我正尝试在 here 上使用新的基于神经网络的解析器查找句子中的所有形容词短语(例如,The weather is extremely good 中的 good 和 extremely good),但
我一直在试验 Stanford NLP 工具包及其词形还原功能。我很惊讶它如何使一些词词形还原。例如: depressing -> depressing depressed -> depressed
我在设置西类牙语版本中的 SUTime 时遇到问题stanford-spanish-corenlp-2018-10-05-models.jar 在斯坦福大学的文档中,它说选项 ner.applyNum
我正在尝试重现一项情感分析研究,该研究使用斯坦福 NLP 库生成的依赖结构,问题是该研究是从 2011 年开始的,我发现斯坦福图书馆使用的是 斯坦福依赖项,但它现在使用通用依赖项,它给出了不同的结果(
如何测试是否 stanfordnlp正在 GPU 上运行吗? Here是一些示例代码: import stanfordnlp stanfordnlp.download('en') # This d
我正在尝试使用 StanfordNLP 解析书本长度的文本 block 。 http 请求运行良好,但文本长度有一个不可配置的 100KB 限制,StanfordCoreNLPServer.java
(注:我知道以前也有关于这个问题的帖子(例如,这里或这里,但它们都很老了,我认为NLP在过去几年里取得了相当大的进展。)。我正在尝试使用Python中的自然语言处理来确定句子的时态。。有没有简单易用的
我是一名优秀的程序员,十分优秀!