python - 如何使用 nltk.Regexp.parser() 解析自定义标签-6ren

python - 如何使用 nltk.Regexp.parser() 解析自定义标签

转载作者：太空宇宙更新时间：2023-11-03 13:43:39

25

4

我的问题类似于这个未回答的问题:Using custom POS tags for NLTK chunking? ，但我得到的错误是不同的。我正在尝试解析添加了我自己的域特定标签的句子。

例如:

(u'greatest', 'P'), (u'internet', 'NN'), (u'ever', 'A'), 
(u',', ','), (u'and', 'CC'), (u'its', 'PRP$'), (u'being', 'VBG'), 
(u'slow', 'N'), (u'as', 'IN'), (u'hell', 'NN')`

其中 (u'slow', 'N') 是自定义标记 'N'。

我正在尝试使用以下方法解析它:

grammar=r"""
Chunk:`{<A>?*<P>+}`
"""
parser=nltk.RegexpParser(grammar)

但是我收到以下错误:

ValueError: Illegal chunk pattern: `{<A>?*<P>+}`

nltk.RegexpParser 是否处理自定义标签？有没有其他基于 nltk 或 python 的解析器可以做到这一点？

最佳答案

nltk.RegexpParser 可以处理自定义标签。

以下是修改代码使其工作的方法:

# Import the RegexpParser
from nltk.chunk import RegexpParser

# Define your custom tagged data. 
tags = [(u'greatest', 'P'), (u'internet', 'NN'), (u'ever', 'A'), 
(u',', ','), (u'and', 'CC'), (u'its', 'PRP$'), (u'being', 'VBG'), 
(u'slow', 'N'), (u'as', 'IN'), (u'hell', 'NN')]

# Define your custom grammar (modified to be a valid regex).
grammar = """ CHUNK: {<A>*<P>+} """

# Create an instance of your custom parser.
custom_tag_parser = RegexpParser(grammar)

# Parse!
custom_tag_parser.parse(tags)

这是您将获得的测试数据的结果:

Tree('S', [Tree('CHUNK', [(u'greatest', 'P')]), (u'internet', 'NN'), (u'ever', 'A'), (u',', ','), (u'and', 'CC'), (u'its', 'PRP$'), (u'being', 'VBG'), (u'slow', 'N'), (u'as', 'IN'), (u'hell', 'NN')])

关于python - 如何使用 nltk.Regexp.parser() 解析自定义标签，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24975573/

25

4

0

文章推荐： python - numpy 不规则步幅数组

文章推荐： c# - DataTemplate 通过转换器绑定(bind)网格背景

文章推荐： c# - 文件未完全下载

文章推荐： c# - 以编程方式控制资源管理器窗口

首页

博学

6Ren·AI

商城

python - 如何使用 nltk.Regexp.parser() 解析自定义标签

标签)？
根据 Web 标准，创建带有标题 1 的链接的正确代码是什么？是吗 stackoverflow 或 stackoverflow 谢谢最佳答案根据网络标准，您不能将 block 元素放入内

首页

博学

6Ren·AI

商城

python - 如何使用 nltk.Regexp.parser() 解析自定义标签

标签)？ 根据 Web 标准，创建带有标题 1 的链接的正确代码是什么？ 是吗 stackoverflow 或 stackoverflow 谢谢 最佳答案 根据网络标准，您不能将 block 元素放入内

标签)？
根据 Web 标准，创建带有标题 1 的链接的正确代码是什么？是吗 stackoverflow 或 stackoverflow 谢谢最佳答案根据网络标准，您不能将 block 元素放入内