azure - Spacy无法加载模型: en_core_web

azure - Spacy无法加载模型: en_core_web_md in Azure databricks

转载作者：行者123 更新时间：2023-12-03 00:57:56

26

4

所以 spacy 似乎已成功安装在 Azure databricks 集群中的笔记本中。

%shpython -m spacy 下载 en_core_web_md

然后我在单元格中使用以下命令对其进行验证

%sh

python -m spacy 验证

这将返回以下结果:

⠙ 正在加载兼容性表...✔ 已加载兼容性表

====================== 已安装的模型 (spaCy v2.3.2) ================= =====ℹ spaCy安装:/databricks/conda/envs/databricks-ml/lib/python3.7/site-packages/spacy

类型名称型号版本
软件包 en-core-web-md en_core_web_md 2.3.1 ✔

因此中英文模型显示为已加载。但是，当运行此命令时

nlp = spacy.load("en_core_web_md")

出现以下错误消息:

操作系统错误:[E050] 找不到模型“en_core_web_md”。它似乎不是快捷方式链接、Python 包或数据目录的有效路径。

最佳答案

您可以按照以下步骤在 Azure Databricks 上安装和加载 spaCy 包。

第 1 步:使用 pip 安装 spaCy 并下载 spaCy 模型。

%sh
/databricks/python3/bin/pip install spacy 
/databricks/python3/bin/python3 -m spacy download en_core_web_sm

笔记本输出:

第 2 步:使用 spaCy 运行示例。

import spacy

# Load English tokenizer, tagger, parser, NER and word vectors
nlp = spacy.load("en_core_web_sm")

# Process whole documents
text = ("When Sebastian Thrun started working on self-driving cars at "
        "Google in 2007, few people outside of the company took him "
        "seriously. “I can tell you very senior CEOs of major American "
        "car companies would shake my hand and turn away because I wasn’t "
        "worth talking to,” said Thrun, in an interview with Recode earlier "
        "this week.")
doc = nlp(text)

# Analyze syntax
print("Noun phrases:", [chunk.text for chunk in doc.noun_chunks])
print("Verbs:", [token.lemma_ for token in doc if token.pos_ == "VERB"])

# Find named entities, phrases and concepts
for entity in doc.ents:
    print(entity.text, entity.label_)

笔记本输出:

关于azure - Spacy无法加载模型: en_core_web_md in Azure databricks，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64915329/

26

4

0

文章推荐： json - 如何防止PowerShell将\添加到字符串

文章推荐： javascript - 将 img 替换为其 data 属性值

文章推荐： mongodb - 在Elasticsearch中跨多个索引和引用文档进行搜索

文章推荐： javascript - 加载/重定向到外部网站时如何添加加载屏幕？

databricks - Databricks 中的目录
我已经开始阅读 Databricks 推出的 Unity Catalog。我了解它试图解决的基本问题，但我不了解目录到底是什么。这在 Databricks 文档中可用， A catalog cont
databricks - 为什么我不使用 Databricks 作为我的数据集市？
我正在努力了解 Databricks。我发现文档逐步从 S3 或 Azure Datalake 导入数据，然后输出到 Azure Synapse Analytics 或其他数据仓库解决方案。快速播
databricks - 以编程方式将库导入到 Databricks 中的工作区
我想以编程方式将(Python Wheel)库添加到 /Shared Databricks 上的工作区。在 GUI(工作区 > 导入 > 库)中很容易做到，但我无法弄清楚如何在 Databricks
databricks - 在 Databricks 笔记本错误中显示图像
我正在创建一个带有公司 Logo 的 databricks 笔记本模板。使用以下代码显示图像会引发错误。代码: %md 错误: HTTP ERROR 403: Invalid or missing
databricks - 如何在现有数据库之上创建具有只读访问权限的 databricks 数据库
我将使用这张图片来形象化我的问题: Databricks1 在 Databricks 中创建数据库(和表)并将其数据存储在存储帐户中。在Databricks2中我想读取数据:Databricks2只有
databricks - Azure Databricks secret 范围 : Azure Key Vault-backed or Databricks-backed
有没有办法通过 python 笔记本确定现有的 Azure Databricks Secret Scope 是否由 Key Vault 或 Databricks 支持？ dbutils.secrets
databricks - 无法将 dbt 连接到 Databricks
我正在尝试连接到 Databricks 上的 Spark 集群，并且正在学习本教程:https://docs.databricks.com/dev-tools/dbt.html .我安装了 dbt-d
databricks - 从 Databricks Autoloader 获取已加载文件的列表
我们可以使用Autoloader跟踪是否已从 S3 存储桶加载的文件。我关于 Autoloader 的问题:有没有办法读取 Autoloader 数据库以获取已加载文件的列表？我可以在 AWS Gl
databricks - 如何将日志从 Azure Databricks 重定向到另一个目的地？
我们可以使用一些帮助来了解如何将 Spark Driver 和 worker 日志发送到 Azure Databricks 之外的目的地，例如Azure Blob 存储或使用 Eleastic-bea
databricks - 如何启用 Databricks Delta 功能
将我的 Azure Databricks 从标准升级到主要，尝试开始使用 Databricks Delta: create table t using delta as select * from t
databricks - 我们可以从 Databricks Autoloader 中排除或仅包含特定的文件扩展名吗？
现在，databricks 自动加载器需要一个目录路径，从中加载所有文件。但是，如果其他类型的日志文件也开始进入该目录 - 有没有办法让 Autoloader 在准备数据帧时排除这些文件？ df =
databricks - 如何使用 Databricks dbutils 从文件夹中删除所有文件
有人可以让我知道如何使用 databricks dbutils 从文件夹中删除所有文件。我尝试了以下但不幸的是，Databricks 不支持通配符。 dbutils.fs.rm('adl://azu
Azure Databricks - 解释 databricks 中的安装语法
我是 azure 的新手和databricks ，我学会了如何安装 blob 和利用，但我有一些疑问，而且我还没有找到任何文档的任何答案。所以请帮我解释一下: dbutils.fs.mount(
azure - Databricks FileInfo : java. lang.ClassCastException : com. databricks.backend.daemon.dbutils.FileInfo 无法转换为 com.databricks.service.FileInfo
尝试遍历已安装的 Databricks 卷中的目录时遇到 ClassCastException。 java.lang.ClassCastException: com.databricks.backen
azure - Databricks FileInfo : java. lang.ClassCastException : com. databricks.backend.daemon.dbutils.FileInfo 无法转换为 com.databricks.service.FileInfo
尝试遍历已安装的 Databricks 卷中的目录时遇到 ClassCastException。 java.lang.ClassCastException: com.databricks.backen
databricks - 如何从 Databricks mnt 目录中删除文件夹/文件
我正在运行 Databricks Community Edition，我想从以下 mnt 目录中删除文件 /mnt/driver-daemon/jars 我运行 dbutils 命令: dbutils
databricks - 如何使用 .netrc 文件验证 Databricks API
我已经在我的机器上创建了“.netrc”文件并尝试在 databricks rest api 调用下面。但它总是给出未经授权的错误。如何在 Databricks 中创建 .netrc 文件？ curl
azure-databricks - 有没有办法恢复 Azure Databricks 中已删除的数据？
没有意识到 shift+enter 运行一个单元格。我正在写一个 delete from table 并按下 shift enter 删除了表中的所有数据。最佳答案在 Delta Lake 表中，
azure-databricks - Databricks 和 Azure 文件
我需要访问 Azure Files来自 Azure Databricks .根据文档 Azure Blobs受支持，但我需要此代码来处理 Azure 文件: dbutils.fs.mount( s
azure-databricks - 使用服务主体从 DataBricks 连接到 Synapse
我正在尝试使用服务主体从 Databricks 连接到 Synapse。我已经在集群配置中配置了服务主体 fs.azure.account.auth.type..dfs.core.windows.n

首页

博学

6Ren·AI

商城

azure - Spacy无法加载模型: en_core_web_md in Azure databricks