gpt4 book ai didi

java - 是否存在不以完整解析为目标的选区解析器?

转载 作者:行者123 更新时间:2023-12-02 02:50:45 27 4
gpt4 key购买 nike

我目前正在处理一组报告样式的文档,我想提取其中的信息。目前,我正在尝试将文本主体划分为更小的组成部分,以进行单独分类(我们期望在短语中获得什么样的信息)。由于编写报告的语法不准确,标准选区解析器无法找到句子的共同词根。这显然需要依赖解析。然而,我感兴趣是否会有不以完整解析句子为目标的选区解析器。沿着概率 CKY 的路线尝试返回最可能的子节点。我目前正在使用 Python nltk 框架,但 Java 解决方案也可以。

最佳答案

听起来您正在寻找“浅层解析”或“分块”。分块器可能只识别文本中的 NP,或者只是 NP 和 VP 等。我不相信 nltk 提供了现成的工具,但训练您自己的非常容易。 Chapter 7 nltk 书中的内容提供了如何创建或训练各种类型的词 block 划分器的详细说明。如果您想要一点层次结构,这些 block 甚至可以嵌套。

关于java - 是否存在不以完整解析为目标的选区解析器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43876234/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com