作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试在句子检测器模型(OpenNLP)中添加自定义功能。默认情况下,它根据这些字符进行检测。, ? !.我想添加一个新角色,以便我的模型能够基于该角色进行检测。
你能建议我如何实现吗?
最佳答案
对于OpenNLP 1.6.0您可以使用SentenceDetectorFactory
。它的构造函数允许您注入(inject)自定义句尾 (eos) 字符(请参阅 JavaDoc ):
SentenceDetectorFactory(String languageCode, boolean useTokenEnd, Dictionary abbreviationDictionary, char[] eosCharacters)
结合SentenceDetectorME
,我们在相应的 JavaDoc 中有此提示。 :
public SentenceDetectorME(SentenceModel model, Factory factory)
Deprecated. Use a SentenceDetectorFactory to extend SentenceDetector functionality.
因此,您可以通过使用自定义 SentenceDetectorFactory
的交换实例扩展 SentenceDetectorME
来实现您自己的 SentenceDetector
实现> 然后使用其他字符来检测句子结尾。
希望有帮助。
关于java - 如何在 OpenNLP 中使用自定义分割字符扩展 SentenceDetector?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31847824/
我是一名优秀的程序员,十分优秀!