gpt4 book ai didi

python - 如何在Python中从给定的句子中找到预期的目标短语或关键词?

转载 作者:太空宇宙 更新时间:2023-11-03 21:34:20 24 4
gpt4 key购买 nike

我想知道是否有任何有效的方法可以从给定的句子中提取预期的目标短语或关键短语。到目前为止,我对给定的句子进行了标记并获取每个单词的 POS 标签。现在我不知道如何从给定的句子中提取目标关键短语或关键字。这样做的方式对我来说并不直观。

这是我输入的句子列表:

sentence_List= {"Obviously one of the most important features of any computer is the human interface.", "Good for everyday computing and web browsing.",
"My problem was with DELL Customer Service", "I play a lot of casual games online[comma] and the touchpad is very responsive"}

这是标记化的句子:

from nltk.tokenize import word_tokenize
tokenized_sents = [word_tokenize(i) for i in sentence_List]
tokenized=[i for i in tokenized_sents]

这里我使用Spacy来获取单词的POS标签:

import spacy
nlp = spacy.load('en_core_web_sm')

res=[]
for i in range(len(sentence_list.index)):
for token in i:
res.append(token.pos_)

所以我可以使用spacy中的NER(又名,名称实体关系),但它的输出与我预定义的预期目标短语不同。有谁知道如何使用 python 中的 Spacy 或 stanfordcorenlp 模块来完成此任务?实现这一目标的有效解决方案是什么?任何想法?预先感谢:)

所需输出:

我想从相应的句子列表中获取目标短语列表,如下所示:

target_phraseList={"human interface","everyday computing","DELL Customer Service","touchpad"}

因此,我将输入 sentence_list 与预期的目标短语连接起来,我最终所需的输出将如下所示:

import pandas as pd
df=pd.Series(sentence_List, target_phraseList)
df=pd.DataFrame(df)

如何使用 spacy 从给定的输入句子列表中获取预期的目标短语?有什么想法吗?

最佳答案

您可以使用 Phrase Matcher 的 spacy 来做到这一点。

from spacy.matcher import PhraseMatcher

matcher = PhraseMatcher(nlp.vocab)
matcher.add('DELL', None, nlp(u"DELL Customer Service"))
doc = nlp(u"My problem was with DELL Customer Service")
matches = matcher(doc)

关于python - 如何在Python中从给定的句子中找到预期的目标短语或关键词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53329158/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com