作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前正在处理一组报告样式的文档,我想提取其中的信息。目前,我正在尝试将文本主体划分为更小的组成部分,以进行单独分类(我们期望在短语中获得什么样的信息)。由于编写报告的语法不准确,标准选区解析器无法找到句子的共同词根。这显然需要依赖解析。然而,我感兴趣是否会有不以完整解析句子为目标的选区解析器。沿着概率 CKY 的路线尝试返回最可能的子节点。我目前正在使用 Python nltk 框架,但 Java 解决方案也可以。
最佳答案
听起来您正在寻找“浅层解析”或“分块”。分块器可能只识别文本中的 NP,或者只是 NP 和 VP 等。我不相信 nltk 提供了现成的工具,但训练您自己的非常容易。 Chapter 7 nltk 书中的内容提供了如何创建或训练各种类型的词 block 划分器的详细说明。如果您想要一点层次结构,这些 block 甚至可以嵌套。
关于java - 是否存在不以完整解析为目标的选区解析器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43876234/
我在 jcrop 上遇到了这个奇怪的问题,我花了几个小时试图弄清楚。问题是我无法以 demo 中所示的相同方式拖动/移动所选内容。 。 如果我尝试使用 setSelect 初始化脚本,以便在页面加载时
我现在正在使用 php 构建一个“更改分类”页面。 我使用 Mysql 作为数据库。 目前我是用PHP获取所有mysql的分类信息,然后输出成这样: $table.=" 2000
我是一名优秀的程序员,十分优秀!