作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我发现了 stanford-NLP 的工具,发现它真的很有趣。
我是一名法国数据挖掘者/数据科学家,喜欢文本分析,并且很想使用您的工具,但是 NER 在法语中不可用,这让我感到非常困惑。
我很想制作我自己的法国 NER,如果它被认为是有值(value)的,甚至可以将其作为对软件包的贡献,所以...您能否向我简要介绍基于斯坦福 coreNLP 为法国 NER 训练 CRF 的要求?
谢谢你。
最佳答案
注意:我不是斯坦福工具的开发者,也不是 NLP 专家。只是一个 lambda 用户,在某些时候也需要这些信息。另请注意,下面给出的部分信息来自官方常见问题解答:http://nlp.stanford.edu/software/crf-faq.shtml#a
以下是我训练自己的 NER 所遵循的步骤:
.tsv
的形式具有以下格式的文件: Venez O
découvrir O
lundi DAY
le O
nouvel O
espace O
de O
vente O
ODHOJS ORGANISATION
java -cp "stanford-ner.jar:lib/*" -mx4g edu.stanford.nlp.ie.crf.CRFClassifier -prop prop.txt
prop.txt
还描述了here ..jar
包含新训练的模型。 java -cp "stanford-ner.jar:lib/*" edu.stanford.nlp.ie.crf.CRFClassifier -loadClassifier ner-model.ser.gz -testFile test.tsv > test.res
test.tsv
具有与 train.tsv
相同的格式文件。 test.res
中的输出有一个包含 NER 预测类的额外列。最后几行还显示了精度、召回率和 F1 方面的摘要。 java -cp "stanford-ner.jar:lib/*" -mx5g edu.stanford.nlp.ie.crf.CRFClassifier -loadClassifier ner-model.ser.gz -textFile test.txt -outputFormat inlineXML > test.res
关于stanford-nlp - 如何基于 stanford-nlp 条件随机场模型训练法国 NER?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37852084/
我是一名优秀的程序员,十分优秀!