- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是 Azure 机器学习新手,正在尝试创建一个简单的 ML 管道。 AzureML 支持 YAML 来定义 ML 管道,此处进行了描述 ( https://learn.microsoft.com/en-us/azure/machine-learning/reference-pipeline-yaml )。
我遇到的一个错误是,当我使用 YAML 文件从“az ml pipeline create”创建管道时,即使我为 data_references 的 bind_mode 指定“download”,它也会返回以下消息。
Messeage: "<class azureml.data.tabular_dataset.TabularDataset'> does not support mount. Only FileDataset supports mount"
环境:
操作系统:Windows 10
Azure CLI:2.11.1
表格数据集的bind_mode似乎不起作用或者我错过了一些东西。我感到困惑的原因是,正如您在上面链接中描述的示例 yaml 文件中看到的那样,具有“bind_mode:download”的数据集应该可以工作。
下面是示例 YAML,其中包含一个名为“dataset1”的表格格式的已定义数据集。
示例 YAML:
pipeline:
name: "Sample ML pipeline YAML"
data_references:
sampleDS:
dataset_name: dataset1
bind_mode: download
default_compute: compute-name
steps:
SampleStep:
type: PythonScriptStep
name: SampleProcessing
script_name: processing.py
allow_reuse: True
source_directory: ".\\src\\pipeline\\steps"
inputs:
input_ds:
source: sampleDS
当 data_references 更改为以下内容(直接指定数据存储中的路径,而不是通过注册的数据集)时,它可以工作。
name: "Sample ML pipeline YAML"
data_references:
sampleDS:
datastore: workspaceblobstore
path_on_datastore: path/of/sampeDS/sample.csv
最佳答案
是的,你说得对。 TabularDataset 不支持下载或挂载。您可以创建并注册一个文件数据集,代码示例将起作用。了解有关数据集类型的更多信息 here
关于Azure机器学习: Creating ML Pipeline from YAML fails: TabularDataset does not support mount.仅FileDataset支持挂载,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63796488/
torchtext.data.TabularDataset 可以从 TSV/JSON/CSV 文件创建,然后可用于从 Glove、FastText 或任何其他嵌入构建词汇表。但我的要求是直接从 lis
train, test = data.TabularDataset.splits(path="./data/", train="train.csv",test="test.csv",format="c
我想用 pytorch 从 tsv 文件创建一个数据集。 我正在考虑使用 torchtext.data.TabularDataset.splits 但我收到一条错误消息。 AttributeError
我使用 Azure ML python API 创建了一个表格数据集。所讨论的数据是驻留在跨多个分区的 Azure Data Lake Gen 2 中的一堆 parquet 文件(约 10K parq
我是 Azure 机器学习新手,正在尝试创建一个简单的 ML 管道。 AzureML 支持 YAML 来定义 ML 管道,此处进行了描述 ( https://learn.microsoft.com/e
我正在使用 Azure ML Python SDK 来构建自定义实验管道。我正在尝试在具有 GPU 的 4 个 VM 集群上并行运行我的表格数据集的训练。我正在关注此链接上提供的文档 https://
我是一名优秀的程序员,十分优秀!