python - NLTK 中没有 pos_tag 的 ne

python - NLTK 中没有 pos_tag 的 ne_chunk

转载作者：太空狗更新时间：2023-10-30 00:59:12

26

4

我正在尝试使用 nltk 中的 ne_chunk 和 pos_tag 对句子进行分块。

from nltk import tag
from nltk.tag import pos_tag
from nltk.tree import Tree
from nltk.chunk import ne_chunk

sentence = "Michael and John is reading a booklet in a library of Jakarta"
tagged_sent = pos_tag(sentence.split())

print_chunk = [chunk for chunk in ne_chunk(tagged_sent) if isinstance(chunk, Tree)]

print print_chunk

这是结果:

[Tree('GPE', [('Michael', 'NNP')]), Tree('PERSON', [('John', 'NNP')]), Tree('GPE', [('Jakarta', 'NNP')])]

我的问题是，是否可以不包含 pos_tag(如上面的 NNP)而只包含树“GPE”、“PERSON”？“GPE”是什么意思？

提前致谢

最佳答案

命名实体分块器将为您提供包含 block 和标签的树。你不能改变它，但你可以把标签去掉。从您的 tagged_sent 开始:

chunks = nltk.ne_chunk(tagged_sent)
simple = []
for elt in chunks:
    if isinstance(elt, Tree):
        simple.append(Tree(elt.label(), [ word for word, tag in elt ]))
    else:
        simple.append( elt[0] )

如果您只想要 block ，请省略上面的 else: 子句。您可以调整代码以按照您想要的任何方式包装 block 。我使用 nltk Tree 将更改保持在最低限度。请注意，有些 block 由多个单词组成(尝试在您的示例中添加“New York”)，因此 block 的内容必须是一个列表，而不是单个元素。

附言。 “GPE”代表“地缘政治实体”(显然是词组错误)。您可以在 nltk 书中看到“常用标签”列表，here .

关于python - NLTK 中没有 pos_tag 的 ne_chunk，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44237087/

26

4

0

文章推荐： python - sklearn standardscaler 结果与手动结果不同

文章推荐： c# - 在调用 DoDragDrop 方法后执行拖放实现

文章推荐： c# - 无需通过电子邮件发送密码即可恢复密码

nltk pos_tag 用法
我正在尝试在 NLTK 中使用语音标记并使用了以下命令: >>> text = nltk.word_tokenize("And now for something completely differe
Python:在 pos_tag 之后重建
使用 pos_tag 后我必须遵循以下结果: list = [('a',` '1'), ('b', '2'), ('c', '3'), ('d', '4')] 现在，我必须像下面这样重建: a b c
python - NLTK:词形还原器和 pos_tag
这个问题在这里已经有了答案: wordnet lemmatization and pos tagging in python (8 个答案) 关闭 7 年前。我构建了一个纯文本语料库，下一步是对我
python - 从列表 pos_tag 序列列表中仅提取名词？
这个问题在这里已经有了答案: How to extract nouns using NLTK pos_tag()? (4 个答案) 关闭 4 年前。我正在尝试使用 nltk.pos_tag() 从
python - 为什么 pos_tag() 如此缓慢且可以避免？
我希望能够以这种方式一个接一个地获取句子的 POS-Tags: def __remove_stop_words(self, tokenized_text, stop_words): sente
python - nltk.pos_tag() 是如何工作的？
nltk.pos_tag() 是如何工作的？它是否涉及任何语料库的使用？我找到了一个源代码(nltk.tag - NLTK 3.0 文档)，上面写着 _POS_TAGGER = 'taggers/ma
Python NLTK pos_tag 未返回正确的词性标记
有这个: text = word_tokenize("The quick brown fox jumps over the lazy dog") 并运行: nltk.pos_tag(text) 我明白
nltk - NLTK 中的 pos_tag 不能正确标记句子
我用过这个代码: # Step 1 : TOKENIZE from nltk.tokenize import * words = word_tokenize(text) # Step 2 : POS
python - 我的 pos_tag 遍历每个字母，我需要它应用于整个单词
我正在为任何将创建的输入文本创建一个Python模板每个单词的 XML 条目及其所属的 POS(词性)。我使用 nltk 中的 pos_tag，但是当我获取单词并尝试对其进行标记时，它会标记每个字
Python - 如何使用 pos_tag (NLTK) 中的标签？
我一直在试图弄清楚如何使用词性标记的“标记”结果。目前我有这个测试代码: 当我运行它时，它会返回以下内容: 这一切都很好。但我希望能够使用这个结果，但我不知道如何使用。如何检查“test”变量是否包含
python - NLTK 正则表达式导致日期和货币的 pos_tag 输出错误
我正在尝试对以下文本进行 pos_tag: text = """5.1 Basic Wage: £350.00 per week payable by monthly instalments in a
python - 我如何制作 NLTK pos_tag 单词而不是字符？
我有这段代码可以在句子中查找名词和动词。 # -*- coding: utf-8 -*- from nltk.corpus import wordnet as wn from nltk import
python - 如何使用 NLTK pos_tag() 提取名词？
我是 python 的新手。我无法找出错误。我想使用 NLTK 提取名词。我写了下面的代码: import nltk sentence = "At eight o'clock on Thursday
python - 如何在 NLTK 中使用 pos_tag？
所以我试图在列表中标记一堆单词(确切地说是词性标记)，如下所示: pos = [nltk.pos_tag(i,tagset='universal') for i in lw] 其中 lw 是单词列表(
python - 将 DataFrame 中的值替换为 pos_tags 字典
这里我有一个 Pandas Dataframe，其中包含包含文本的“body”列。 body 0 David Beckham's dreams of kick starting
python - NLTK 中没有 pos_tag 的 ne_chunk
我正在尝试使用 nltk 中的 ne_chunk 和 pos_tag 对句子进行分块。 from nltk import tag from nltk.tag import pos_tag from n
nlp - nltk.word_tokenize 和 nltk.pos_tag 支持哪些语言
我需要对多种语言的文本进行名称实体提取:西类牙语、葡萄牙语、希腊语、捷克语、中文。是否有这两个功能的所有支持语言的列表？是否有使用其他语料库的方法，以便可以包含这些语言？最佳答案默认情况下，这两
python - 从 NTLK pos_tag 中仅删除 'NN' 个单词
我有一个使用 NLTK 查找名词和动词的代码。 from nltk.corpus import wordnet as wn from nltk import pos_tag import nltk s
python - 仅从 (word,pos_tag) 的元组中获取 POS 标签列表
我有一个句子列表列表，用单词标记，然后进行 pos 标记，所以结果显然是一个包含元素的列表: [(w1,pos_tag1)(w2,pos_tag2)] [(w3,pos_tag3),(w4,pos_t
windows - NLTK v3.2 : Unable to nltk. pos_tag()
嗨文本挖掘冠军，我在 Windows 10 上使用带有 NLTK v3.2 的 Anaconda。(客户端环境) 当我尝试使用 POS 标记时，我不断收到 URLLIB2 错误: URLError:

首页

博学

6Ren·AI

商城

python - NLTK 中没有 pos_tag 的 ne_chunk