gpt4 book ai didi

nlp - 有没有一种简单的方法可以按spacy顺序获取 token 的位置?

转载 作者:行者123 更新时间:2023-12-02 16:35:37 25 4
gpt4 key购买 nike

我想要序列中每个标记的起始索引和结束索引。有没有一种简单的方法可以用 spacy 做到这一点?

例如:

text='Brown is a nice guy'
spacy_doc=nlp(text)

for sent in spacy_doc.sents:
for token in sent:
print(token.text, token.i)


Brown 0
is 1
a 2
nice 3
guy 4

这不是我需要的。我需要

Brown 0,4
is 6,7
a 9,9
nice 11,14
guy 16,18

最佳答案

import spacy

text = 'Brown is a nice guy'
nlp = spacy.load("en_core_web_sm")
doc = nlp(text)

for token in doc:
print(token.text, token.idx, token.idx + len(token.text) - 1)

输出

Brown 0 4
is 6 7
a 9 9
nice 11 14
guy 16 18

关于nlp - 有没有一种简单的方法可以按spacy顺序获取 token 的位置?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62766608/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com