gpt4 book ai didi

python - 仅从 (word,pos_tag) 的元组中获取 POS 标签列表

转载 作者:行者123 更新时间:2023-11-28 21:43:33 26 4
gpt4 key购买 nike

我有一个句子列表列表,用单词标记,然后进行 pos 标记,所以结果显然是一个包含元素的列表:

[(w1,pos_tag1)(w2,pos_tag2)]
[(w3,pos_tag3),(w4,pos_tag4),(w5,pos_tag5)]
[(w6,pos_tag6),(w7,pos_tag7)]

我只需要按照它们在所有句子中出现的相同顺序获取 pos_tags 列表。我尝试的是对列表进行迭代

tags = [x[1] for x in list in element]

但这不起作用。我怎样才能拥有这些列表中的所有标签?

谢谢

最佳答案

您可以使用zip(*list) 习惯用法解压元组列表,参见Unpacking a list / tuple of pairs into two lists / tuples

>>> from nltk import pos_tag
>>> tagged_sent = pos_tag('The quick brown fox jumps over the lazy dog'.split())
>>> tagged_sent
[('The', 'DT'), ('quick', 'JJ'), ('brown', 'NN'), ('fox', 'NN'), ('jumps', 'VBZ'), ('over', 'IN'), ('the', 'DT'), ('lazy', 'JJ'), ('dog', 'NN')]
>>> words, tags = zip(*tagged_sent)
>>> tags
('DT', 'JJ', 'NN', 'NN', 'VBZ', 'IN', 'DT', 'JJ', 'NN')

关于python - 仅从 (word,pos_tag) 的元组中获取 POS 标签列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42003418/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com