gpt4 book ai didi

spaCy nlp - 实体在字符串中的位置,提取附近的词

转载 作者:行者123 更新时间:2023-12-04 16:01:26 25 4
gpt4 key购买 nike

假设我有一个字符串并想标记一些实体,例如组织。

string = 我在印度银行担任营销主管,工作了 4 个月..

string_tagged = 我在 [Bank of India] 担任营销主管,工作了 4 个月..

我想识别标记实体旁边的单词。如何定位标记实体的位置并提取实体旁边的单词?

我的代码:

import spacy    
nlp = spacy.load('en')
doc = nlp(string)
company = doc.text
for ent in doc.ents:
if ent.label_ == 'ORG':
company = company[:ent.start_char] + company[:ent.start_char -1] +company[:ent.end_char +1]
print company

最佳答案

我从你的问题中了解到,你想要在 ORG 标记的 token 旁边添加文字:

import spacy    
nlp = spacy.load('en')
#string = "blah blah"
doc = nlp(string)
company = ""
for i in range (1, len(doc)-1)):
if doc[i].ent.label_ == 'ORG':
company = doc[i-1] + doc[i] + doc[i+1] # previous word, tagged word and next one
print company

注意第一个和最后一个 token 检查。

关于spaCy nlp - 实体在字符串中的位置,提取附近的词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50386379/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com