gpt4 book ai didi

java - 调整 StanfordCoreNLP 来处理嘈杂的网络文本?

转载 作者:行者123 更新时间:2023-11-29 08:55:38 25 4
gpt4 key购买 nike

我一直在网站上手动尝试 StanfordCoreNLP NER 和所有内容,例如,它们似乎依赖于非常具体/正确的英语提示来检测实体。但是,在处理网络文本时,您可以在其中放置一些文本,如


李四

计算机科学助理教授

斯坦福大学


StanfordNLP 似乎遇到了一些麻烦(由于缺少介词/标点符号,将整个事物标记为一个组织)。我能做些什么来让 NER 更好地处理这种文本(例如编写一些文本预处理程序)?

最佳答案

在每行末尾添加点 (.) 可获得更好的结果。 (因为分句器使用点作为分隔符)

关于java - 调整 StanfordCoreNLP 来处理嘈杂的网络文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20414965/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com