gpt4 book ai didi

python - 从英文文本中提取产品名称

转载 作者:塔克拉玛干 更新时间:2023-11-03 06:31:41 25 4
gpt4 key购买 nike

我想从英文文本中提取所售产品的名称。

例如:

"I'm selling my xbox brand new"

"Selling rarely used 27 inch TV"

应该给我 “xbox”“27 inch TV”

目前我唯一能想到的就是在一个巨大的重要名词和重要形容词列表中进行硬编码:['tv', 'fridge', 'xbox', 'laptop', etc]

有没有更好的方法?

最佳答案

看起来 nltk 会给你一个单词列表和它们的词性。既然你只对名词感兴趣? this将为您提供它们

>>> from nltk import pos_tag, word_tokenize
>>> pos_tag(word_tokenize("John's big idea isn't all that bad."))
[('John', 'NNP'), ("'s", 'POS'), ('big', 'JJ'), ('idea', 'NN'), ('is',
'VBZ'), ("n't", 'RB'), ('all', 'DT'), ('that', 'DT'), ('bad', 'JJ'),
('.', '.')]

关于python - 从英文文本中提取产品名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14510028/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com