stanford-nlp - 使用 Core NLP 和 Stanford Parser 执行词性标注的结果不同？-6ren

stanford-nlp - 使用 Core NLP 和 Stanford Parser 执行词性标注的结果不同？

转载作者：行者123 更新时间：2023-12-01 11:34:16

32

4

斯坦福解析器和斯坦福 CoreNlp 的词性 (POS) 模型用途不同，这就是为什么通过 Stanford Parser 和 CoreNlp 执行的 POS 标记的输出存在差异。

在线核心 NLP 输出
- /DT man/NN 是/VBZ smoking/NN ./.
- A/DT 女人/NN 骑马/NNS a/DT 马/NN ./.
在线斯坦福解析器输出
- /DT man/NN 是/VBZ smoking/VBG ./.
- A/DT 女人/NN 骑马/VBZ a/DT 马/NN ./.同样多的句子

是否有比较两个模型的文档以及对差异的其他详细解释？

对于这些情况，corenlp 的输出似乎是错误的。除了我在错误分析过程中检查的几句话外，我想会有很多类似的情况可能会出现此类错误。

最佳答案

这与 CoreNLP 无关，而是关于您是使用 Stanford 词性标注器还是 Stanford Parser(PCFG 解析器)来进行词性标注。 (PCFG 解析器通常将 POS 标记作为其解析算法的一部分，尽管它也可以使用从其他地方提供的 POS 标记。)两者有时都会出错。平均而言，词性标注器是比解析器稍微好一点的词性标注器。但是，有时解析器会获胜，特别是，有时它似乎更擅长标记涉及集成子句级信息的决策。无论如何，这两个示例都是正确的 - 尽管我敢打赌您也可以找到一些相反的示例。

如果您想在 CoreNLP 中使用 PCFG 解析器进行词性标注，只需省略词性标注器，并提前移动解析器，以便词性标记可用于词形还原器和基于正则表达式的 NER:

java -mx3g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,parse,lemma,ner,dcoref -file test.txt

但是，我们的一些其他解析器(NN 依赖解析器、SR 选区解析器)需要先完成 POS 标记。

关于stanford-nlp - 使用 Core NLP 和 Stanford Parser 执行词性标注的结果不同？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28989483/

32

4

0

文章推荐： java - 如何分割包含网页地址的两个句子？

文章推荐： java - 接口(interface)的使用有多种方式访问？

文章推荐： java - 如何阻止程序退出二维数组的边界

文章推荐： sas - SAS 中 TRANWRD 的问题

parsing - 创建类型为 Parser a -> Parser b -> Parser (要么 a b)的解析器组合器
我想解析一些文本，其中某些字段在大多数情况下都具有结构，但偶尔(由于特殊大小写、拼写错误等)该结构会丢失。例如常规情况是 Cost: 5，但偶尔会显示 Cost: 5m 或 Cost: 3 + 1
java - parser.setFeature 与 parser.setValidating
以下有什么区别: parser.setFeature("http://xml.org/sax/features/validation",true); and parser.setFeature("ht
node.js - npm 错误! EPROTO : protocol error, 符号链接(symbolic link) '../@babel/parser/bin/babel-parser.js' -> '/home/vagrant/code/proadco.test/node_modules/.bin/parser'
我尝试在 Windows 8.1 上的 Git Bash 客户端中执行 npm install，但收到以下错误: npm WARN optional SKIPPING OPTIONAL DEPENDE
types - 理解这个 elm url-parser Parser 类型声明
试图理解 evancz/url-parser 模块时，我偶然发现了这种我难以理解的类型声明:( source ) type Parser a b = Parser (State a -> List
typescript - ESLint 配置中的 "parser"和 "parserOptions.parser"有什么区别？
我长期使用下面的 TypeScript 和 Vue 预设。它有效，但我还没有理解每个选项，现在要理解它。第一:parser之间有什么区别？和 @typescript-eslint/parser ？ p
javascript - node-sql-parser ， parser.astify(sqlquery) 不返回准确的输出
我正在尝试使用node-sql-parser在nodejs中解析sql查询。 const {Parser} = require('node-sql-parser'); const parser = n
javascript - AgnualrJs - $parsers.unshift 与 $parsers.push 的区别
自定义指令中的 ngModelCtrl.$parsers.unshift 和 ngModelCtrl.$parsers.push 之间的确切区别是什么。当发生对模型生效但对表单本身无效的事情时，我想
java - XML Pull Parser 和 SAX Parser 有什么区别
我正在寻找 SAX 和 Pull Parser 之间的主要区别。我知道 SAX 解析器非常适合处理大型 XML 文件，因为它不存储 XML 并且只在一个方向上遍历。与 DOM 相比。但我无法找到 SA
c++ - 对 QJson::Parser::Parser 的 undefined reference
我已经按照存档中的说明成功(？)安装了 QJson 库。但是编译器给我这个错误: Undefined reference to QJSon::Parser::Parser(). 我找到了安装库文件的位
html - 我应该使用 HTML::Parser 还是 XML::Parser 来提取和替换文本？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，
Java cucumber -java.lang.NoSuchMethodError : gherkin. parser.Parser.parse
尝试实现 Cucumber 来进行一些自动化测试。当我使用 junit 运行测试时，出现以下错误项目路径: src/test/java/ cucumberJava -cucumberjava,ja
node.js - Node Body Parser 和 cookie parser 有什么作用？我应该使用它们吗？
我已经阅读了我能找到的所有文档，但是我找不到关于这两个中间件的作用的简单解释。 body-parser 中的body 指的是什么？为什么需要解析正文？ Cookie 也类似。我是否更正了 cookie
java - Deorg.apache.xerces.parsers.XIncludeAwareParserConfiguration无法转换为org.apache.xerces.xni.parser.XMLParserConfiguration
我在gradle项目中使用Xerces jar，然后在gradle插件中使用该项目的jar:实际上，我正在开发一个gradle插件，其中包含使用gradle项目jar的某些功能的自定义任务；当我尝试运
java - org.apache.commons.net.ftp.parser.ParserInitializationException : Unknown parser type: Linux
我正在尝试连接到 Linux 上的 FTP 服务器，当我执行 ftp.listFiles(remote); 时遇到异常 SYST 215 Linux Exception in thread "AW
reactjs - 创建 react 应用程序-没有 typescript ，得到了错误: Failed to load parser '@typescript-eslint/parser'
我有react-app的示例安装，我得到了以下内容 Error: Failed to load parser '@typescript-eslint/parser' declared in '.esl
java - ClassCastException : org. apache.xerces.parsers.XIncludeAwareParserConfiguration 无法转换为 org.apache.xerces.xni.parser.XMLParserConfiguration
我在 there 中提到过类似的问题.我正在使用 mvn clean compile site 命令，我的版本是: cobertura.version: 2.5.1 findbugs.version:
java - ClassCastException : org. apache.xerces.parsers.XIncludeAwareParserConfiguration 无法转换为 org.apache.xerces.xni.parser.XMLParserConfiguration
我正在 Eclipse 中开发 GWT 应用程序并使用 jdom2 读取一些自定义 xml 属性文件。在最近的更新之后，我的应用程序现在在尝试读取 xml 文件时失败并出现上述错误。相关堆栈跟踪是:
java.lang.IllegalAccessError : class javax. xml.parsers.SecuritySupport12 无法访问其父类(super class) javax.xml.parsers.SecuritySupport
我正在使用 spring+maven。我正在 tomcat 服务器中部署我的应用程序。当我尝试运行我的应用程序时，突然出现以下错误。 INFO: Starting Servlet Engine: Ap
python - 使用 "import dateutil"和 "dateutil.parser.parse()"时出现 AttributeError 但使用 "from dateutil import parser"时没有问题
我在玩dateutil module在 Python 2.7.3 中。我只是想使用: import dateutil dateutil.parser.parse("01-02-2013") 但我得到了
Python基于argparse与ConfigParser库进行入参解析与ini parser
一.入参解析库 argparse 　　有时候写Python脚本，需要处理入参[-h][-v][-F]...等情况，如果自己来解析的话，会花费很多时间，而且也容易出问题，好在Python有现成的li

首页

博学

6Ren·AI

商城

stanford-nlp - 使用 Core NLP 和 Stanford Parser 执行词性标注的结果不同？