gpt4 book ai didi

python - Spacy 提取特定名词短语

转载 作者:太空狗 更新时间:2023-10-29 22:21:02 26 4
gpt4 key购买 nike

我可以在 python 中使用 spacy 来查找具有特定邻居的 NP 吗?我想要我的文本中前后都有动词的名词短语。

最佳答案

  1. 您可以合并名词短语(这样它们就不会被单独标记)。
  2. 分析依赖解析树,并查看相邻标记的 POS。

    >>> import spacy
    >>> nlp = spacy.load('en')
    >>> sent = u'run python program run, to make this work'
    >>> parsed = nlp(sent)
    >>> list(parsed.noun_chunks)
    [python program]
    >>> for noun_phrase in list(parsed.noun_chunks):
    ... noun_phrase.merge(noun_phrase.root.tag_, noun_phrase.root.lemma_, noun_phrase.root.ent_type_)
    ...
    python program
    >>> [(token.text,token.pos_) for token in parsed]
    [(u'run', u'VERB'), (u'python program', u'NOUN'), (u'run', u'VERB'), (u',', u'PUNCT'), (u'to', u'PART'), (u'make', u'VERB'), (u'this', u'DET'), (u'work', u'NOUN')]
  3. 通过分析相邻标记的词性,您可以得到您想要的名词短语。

  4. 更好的方法是分析 dependency parse tree , 并查看名词短语的左右,这样即使名词短语和动词之间有标点符号或其他POS标记,也可以增加搜索范围

关于python - Spacy 提取特定名词短语,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44661200/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com