- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用从以下代码获取的 POS 标签构建 PCFG:
from nltk.corpus import treebank
corpus = treebank.tagged_sents(tagset='universal')
tags = set()
for sent in corpus:
for (word, tag) in sent:
tags.add(tag)
tags = list(tags)
print tags
给予,
['ADV', 'NOUN', 'ADP', 'PRON', 'DET', '.', 'PRT', 'NUM', 'X', 'CONJ', 'ADJ', 'VERB']
我需要使用上面的 POS 标签生成 PCFG。但是,当我尝试使用规则
构建语法时nltk.grammar.PCFG.fromstring("""T5 -> . NT6 [0.136235]""")
它产生
ValueError: Unable to parse line 1: T5 -> . NT6 [0.136235]
Expected a nonterminal, found: . NT6 [0.136235]
我假设异常表明“.”不是 nltk.grammar.PCFG
中的有效非终结符。但我想知道是否有一个巧妙的方法来解决这个问题。
相关
nltk cant interpret grammar category PRP$ output by stanford parser提供了一个很好的修复,将树库标记集中的“$”添加到语法中。但树库 POS 标记集再次包含单引号 (' ') 作为 POS 标记,这不是有效的符号。
是否有一种巧妙的方法可以解决此问题,而无需将每个特殊字符添加到语法中?
最佳答案
我得到了这个问题的答案。不使用 fromstring
方法,而是通过传递 nltk.ProbabilisticProduction
对象列表和 nltk.Nonterminal
对象来生成 PCFG 对象,如下所示:
from nltk import ProbabilisticProduction
from nltk.grammar import PCFG
from nltk import Nonterminal as NT
g = ProbabilisticProduction(NT('TS'), [NT('.'), NT('NT6')], prob=1)
# Adding a terminal production
g = ProbabilisticProduction(NT('NT6'), ['terminal'], prob = 1)
start = NT('Q0') # Q0 is the start symbol for my grammar
PCFG(start, [g]) # Takes a list of ProbabilisticProductions
关于python - 从通用标签集生成 PCFG,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43037697/
这个问题已经有答案了: nltk cant interpret grammar category PRP$ output by stanford parser (1 个回答) 已关闭 6 年前。 我正
我的教授要求我研究并实现 PCFG(概率上下文无关语法)中的无监督内外学习算法。 说到无监督,我的教授告诉我唯一的输入是一些训练句子和非终端的数量。我的程序应该从他们那里学到的是每个规则的概率(规则是
我知道有多种函数可用于 Python 中的通用 CFG 和 PCFG;但是它们的速度似乎都不同。 例如:NLTK、PyParsing。 最近是否有任何基准比较与速度和内存使用相关的各种属性? 最佳答案
我想知道是否可以使用 NLTK 工具包训练(在树库上)和使用词法化的 PCFG?它支持它还是有一些方法可以轻松做到这一点?有没有其他工具可以做到这一点? 最佳答案 您检查了以下内容吗?: http:/
import nltk from nltk.parse import ViterbiParser def pcfg_chartparser(grammarfile): f=open(gramm
我正在尝试使用 ViterbiParser 和 ChartParser 来解析句子“Birds Fly”。跟踪进程,看起来应该可以工作,但总是返回 None 这是痕迹。(维特比): Inserting
我是一名优秀的程序员,十分优秀!