gpt4 book ai didi

python - spacy-udpipe 与 pytextrank 从非英语文本中提取关键字

转载 作者:太空宇宙 更新时间:2023-11-03 19:51:19 24 4
gpt4 key购买 nike

我一直在使用 pytextrank ( https://github.com/DerwenAI/pytextrank/ ) 和 spacy 和 English 模型来提取关键字 - 它效果很好!

现在我需要处理非英语文本,我找到了 udpipe ( https://github.com/TakeLab/spacy-udpipe ),但它不能开箱即用......之后

nlp = spacy_udpipe.load("sk")
tr = pytextrank.TextRank()
nlp.add_pipe(tr.PipelineComponent, name="textrank", last=True)
doc = nlp(text)

我获得了带有 POS 和 DEP 标签的 token ,但 doc._.phrases 中没有任何内容(doc.noun_chunks 也是空的)和 nlp .pipe_names 只是 ['textrank']

我应该向 spacy 的管道添加什么才能使其正常工作?我假设 pytextrank 需要 noun_chunks...

任何提示或建议都可以帮助我 - 谢谢!

最佳答案

您介意在 PyTextRank 存储库上提出有关此问题的问题吗? https://github.com/DerwenAI/pytextrank/issues

另外,如果您可以的话,请提供要使用的示例文本(以请求的语言)

我们将尝试调试此集成。

感谢您指出!

帕科

关于python - spacy-udpipe 与 pytextrank 从非英语文本中提取关键字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59824405/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com