- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 StanfordNLP 解析书本长度的文本 block 。 http 请求运行良好,但文本长度有一个不可配置的 100KB 限制,StanfordCoreNLPServer.java 中的 MAX_CHAR_LENGTH。
目前,我在将文本发送到服务器之前将其切碎,但即使我尝试在句子和段落之间进行拆分,这些 block 之间也会丢失一些有用的共指信息。据推测,我可以解析具有较大重叠的 block 并将它们链接在一起,但这似乎 (1) 不优雅且 (2) 需要相当多的维护。
是否有更好的方法来配置服务器或请求以删除手动分块或跨 block 保留信息?
顺便说一句,我正在使用 python 请求模块进行 POST,但我怀疑这会有所不同,除非 corenlp python 包装器以某种方式处理这个问题。
最佳答案
您应该能够使用标志 -maxCharLength -1
启动服务器,这将摆脱句子长度限制。请注意,这在生产中是不可取的:任意大的文档都会消耗任意大量的内存(和时间),尤其是像 coref 这样的东西。
服务器的选项列表应该可以通过使用 -help
调用服务器来访问,并且是 documented in code here .
关于stanford-nlp - 如何解决 StanfordNLP 服务器的 100K 字符限制?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46678204/
基本上,在句子中: is a fantasy movie. 我想检测化合物Lord of the bracelets作为一个实体(也可以在实体链接注释器中链接)。这意味着检测具有类似 NNP 形式的
我刚刚安装了 python stanford nlp,运行良好:- pip 安装 stanfordnlp 我在 python shell 中尝试实例化包,但出现以下错误:- >>> import st
我正尝试在 here 上使用新的基于神经网络的解析器查找句子中的所有形容词短语(例如,The weather is extremely good 中的 good 和 extremely good),但
我一直在试验 Stanford NLP 工具包及其词形还原功能。我很惊讶它如何使一些词词形还原。例如: depressing -> depressing depressed -> depressed
我在设置西类牙语版本中的 SUTime 时遇到问题stanford-spanish-corenlp-2018-10-05-models.jar 在斯坦福大学的文档中,它说选项 ner.applyNum
我正在尝试重现一项情感分析研究,该研究使用斯坦福 NLP 库生成的依赖结构,问题是该研究是从 2011 年开始的,我发现斯坦福图书馆使用的是 斯坦福依赖项,但它现在使用通用依赖项,它给出了不同的结果(
如何测试是否 stanfordnlp正在 GPU 上运行吗? Here是一些示例代码: import stanfordnlp stanfordnlp.download('en') # This d
我正在尝试使用 StanfordNLP 解析书本长度的文本 block 。 http 请求运行良好,但文本长度有一个不可配置的 100KB 限制,StanfordCoreNLPServer.java
(注:我知道以前也有关于这个问题的帖子(例如,这里或这里,但它们都很老了,我认为NLP在过去几年里取得了相当大的进展。)。我正在尝试使用Python中的自然语言处理来确定句子的时态。。有没有简单易用的
我是一名优秀的程序员,十分优秀!