作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 spacy 预处理数据以进行情感分析。
我想做的是:
1) 词形还原
2)词形还原词的词性标记
但是,由于 spacy 在调用解析器时会立即执行所有过程,因此所有计算都会执行两次。是否有一个选项可以禁用不需要的计算?
最佳答案
查看 Language.call 方法以了解如何按顺序应用各个进程。数量不多——基本上是:
doc = nlp.tokenizer(text)
nlp.tagger(doc)
nlp.parser(doc)
nlp.entity(doc)
如果您需要不同的序列,您应该编写自己的函数以不同的方式将它们串在一起。
不过,我不确定你问的是否有意义。如果将词性标注器应用于词形还原文本,统计模型可能不会表现得很好。屈折后缀是重要的特征。
关于python - 是否可以在spacy中独立进行词形还原?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40052283/
我是一名优秀的程序员,十分优秀!