stanford-nlp - 如何解决 StanfordNLP 服务器的 100K 字符限制？-6ren

stanford-nlp - 如何解决 StanfordNLP 服务器的 100K 字符限制？

转载作者：行者123 更新时间：2023-12-02 03:00:01

25

4

我正在尝试使用 StanfordNLP 解析书本长度的文本 block 。 http 请求运行良好，但文本长度有一个不可配置的 100KB 限制，StanfordCoreNLPServer.java 中的 MAX_CHAR_LENGTH。

目前，我在将文本发送到服务器之前将其切碎，但即使我尝试在句子和段落之间进行拆分，这些 block 之间也会丢失一些有用的共指信息。据推测，我可以解析具有较大重叠的 block 并将它们链接在一起，但这似乎 (1) 不优雅且 (2) 需要相当多的维护。

是否有更好的方法来配置服务器或请求以删除手动分块或跨 block 保留信息？

顺便说一句，我正在使用 python 请求模块进行 POST，但我怀疑这会有所不同，除非 corenlp python 包装器以某种方式处理这个问题。

最佳答案

您应该能够使用标志 -maxCharLength -1 启动服务器，这将摆脱句子长度限制。请注意，这在生产中是不可取的:任意大的文档都会消耗任意大量的内存(和时间)，尤其是像 coref 这样的东西。

服务器的选项列表应该可以通过使用 -help 调用服务器来访问，并且是 documented in code here .

关于stanford-nlp - 如何解决 StanfordNLP 服务器的 100K 字符限制？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46678204/

25

4

0

文章推荐： puppeteer - Chrome puppeteer 在错误事件上关闭页面

文章推荐： vuejs2 - Vue JS Quasar 框架转换渲染与路由器 View 的冲突

文章推荐： r - 使用 rollapply 从向量中有条件地提取

java - 斯坦福自然语言处理(StanfordNLP)检测带有介词的复合实体
基本上，在句子中: is a fantasy movie. 我想检测化合物Lord of the bracelets作为一个实体(也可以在实体链接注释器中链接)。这意味着检测具有类似 NNP 形式的
导入库时 Python StanfordNLP 包错误
我刚刚安装了 python stanford nlp，运行良好:- pip 安装 stanfordnlp 我在 python shell 中尝试实例化包，但出现以下错误:- >>> import st
parsing - 如何使用 StanfordNLP Python 包做依赖解析？
我正尝试在 here 上使用新的基于神经网络的解析器查找句子中的所有形容词短语(例如，The weather is extremely good 中的 good 和 extremely good)，但
java - StanfordNLP 词形还原无法处理 -ing 词
我一直在试验 Stanford NLP 工具包及其词形还原功能。我很惊讶它如何使一些词词形还原。例如: depressing -> depressing depressed -> depressed
java - 使用西类牙语为斯坦福自然语言处理 (StanfordNLP) 配置 SUTime - Java
我在设置西类牙语版本中的 SUTime 时遇到问题stanford-spanish-corenlp-2018-10-05-models.jar 在斯坦福大学的文档中，它说选项 ner.applyNum
python - 在 python stanfordnlp 中使用斯坦福依赖项(而不是通用依赖项)
我正在尝试重现一项情感分析研究，该研究使用斯坦福 NLP 库生成的依赖结构，问题是该研究是从 2011 年开始的，我发现斯坦福图书馆使用的是斯坦福依赖项，但它现在使用通用依赖项，它给出了不同的结果(
python - 如何测试 stanfordnlp 是否在 GPU 上运行？
如何测试是否 stanfordnlp正在 GPU 上运行吗？ Here是一些示例代码: import stanfordnlp stanfordnlp.download('en') # This d
stanford-nlp - 如何解决 StanfordNLP 服务器的 100K 字符限制？
我正在尝试使用 StanfordNLP 解析书本长度的文本 block 。 http 请求运行良好，但文本长度有一个不可配置的 100KB 限制，StanfordCoreNLPServer.java
Python NLP: identifying the tense of a sentence using TextBlob, StanfordNLP or Google Cloud(Python NLP：使用TextBlob、StanfordNLP或Google Cloud识别句子的时态)
(注：我知道以前也有关于这个问题的帖子(例如，这里或这里，但它们都很老了，我认为NLP在过去几年里取得了相当大的进展。)。我正在尝试使用Python中的自然语言处理来确定句子的时态。。有没有简单易用的

首页

博学

6Ren·AI

商城

stanford-nlp - 如何解决 StanfordNLP 服务器的 100K 字符限制？