- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我的句子是:在此方案之前,她有另一种单独使用 5-FU 的化疗方案历史,没有任何明显的副作用。
当我将它放在位移 (https://demos.explosion.ai/displacy/) 中时,输出包含对 5-FU 作为名词短语的引用。
但是,当我注释文本并搜索名词 block 时,我没有将 5-FU 显示为名词 block 。
nlp = spacy.load('en')
ax = nlp(我的句子)
对于 ax.noun_chunks 中的 w:print(w)
编辑此外,当我使用以下代码搜索标签时,我将 5-FU 显示为 NN。如果 Spacy 的注释将这个单独的单词理解为一个被介词包围的名词,那么为什么不应该将该单词作为名词短语来拾取呢?结束编辑
我做错了什么? displaCy 和我使用的版本之间有版本差异吗?是否有 spaCy 帮助团队来解决这个问题?
非常感谢!
最佳答案
Displacy 在显示解析树时会做一些预处理。这是 displacy 使用的解析服务(建立在 spacy 上)的链接: https://github.com/explosion/spacy-services/blob/master/displacy/displacy_service/parse.py#L25
if collapse_phrases:
for np in list(self.doc.noun_chunks):
np.merge(np.root.tag_, np.root.lemma_, np.root.ent_type_)
斯帕西 merges句子中的名词 block 而不是将它们视为单独的标记,这就是您的输出不同的原因。
另一个区别是 models你使用的。您可能正在使用最小的 en_core_web_sm 而 Spacy 可能正在使用更大的 en_core_web_md(尽管它没有在任何地方正式提及)
关于python - spacy 和 displacy 输出不同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44496844/
我有一个单词、名词-动词短语列表,我想: 在文本语料库中搜索依赖模式、单词 识别匹配的段落出现在 摘录段落 高亮段落中匹配的词 创建段落的片段/jpeg,突出显示匹配的词 将图像保存在 Excel 中
我正在按照 https://spacy.io/usage/visualizers 上的说明进行操作并尝试在 Jupyter Notebook 和 Spyder 上使用以下代码可视化依赖项解析: imp
我的句子是:在此方案之前,她有另一种单独使用 5-FU 的化疗方案历史,没有任何明显的副作用。 当我将它放在位移 (https://demos.explosion.ai/displacy/) 中时,输
我有一个文本文件,我使用 SpaCy 创建了一个 DOC 对象: doc = nlp.make_doc(raw_text) 我还有一个针对此 DOC 对象中每个单词的自定义 IOP 标签列表: ['O
我有以下代码: import spacy from spacy import displacy from pathlib import Path nlp = spacy.load('en_core_w
我想使用 spaCy 在这里提供的代码保存 spaCy 的可视化效果:https://spacy.io/usage/visualizers 这是我的代码: nlp = spacy.load("en_c
我是一名优秀的程序员,十分优秀!