gpt4 book ai didi

python - 过滤特定语音部分 NLTK

转载 作者:行者123 更新时间:2023-12-01 05:23:20 27 4
gpt4 key购买 nike

这一定很简单,但我不知何故错过了它。我有代码:

import nltk

f=open('...\\t.txt','rU')
raw=f.read()
tokens = nltk.word_tokenize(raw)
print nltk.pos_tag(tokens)

例如返回:

"[('进程', 'NNS'), ('a', 'DT'), ('序列', 'NN'), ('of', 'IN'), ('单词', 'NNS')]

我想知道如何仅收集所有“NN”或所有“DT”和“IN”而不是字符串的每个成员。

提前致谢

最佳答案

您可以通过列表理解仅提取所需的标签,例如:

>>> tags = nltk.pos_tag(tokens)
>>> dt_tags = [t for t in tags if t[1] == "DT"]
>>> dt_tags
[('a', 'DT')]

关于python - 过滤特定语音部分 NLTK,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21882460/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com