gpt4 book ai didi

python - 如何访问 azureml FileDataSet 中的文件(图像)?

转载 作者:行者123 更新时间:2023-12-05 01:13:36 24 4
gpt4 key购买 nike

我已将一个大 (10+gb) 数据集上传到 Azure Blob 存储中,其中包含数千张图像 (jpg) 格式。
我在 Azure 机器学习服务中将 blob 容器注册为数据存储,我还注册了一个文件数据集,指向包含图像的实际 blob 容器。 (显示有 44440 张图片)。

现在,我想运行一个需要读取特定图像并将其加载到图像中的笔记本(在 AzureML 中)(使用 cv2.imread())。但是,我似乎没有为此找到合适的文档...我看到的唯一选择是将整个数据集下载到本地临时存储中,我不想这样做(多个千兆字节)。

我可以使用一个选项来访问实际文件引用并将其传递给我的第 3 方方法吗?

您可以在下面找到一些相关的代码:

# get workspace and datastore
ws = Workspace.from_config()
dstore = ws.datastores[datastore_name]
image_dataset = ws.datasets[image_dataset_name]

mounted_images = image_dataset.mount()

img = cv2.imread(mounted_images['my_file_name.jpg']) # this will not work

关于如何让它工作的任何想法?

谢谢

最佳答案

dataset.mount() 实际上返回一个具有 mount_point 属性的 MountContext。

所以:

img = cv2.imread(mounted_images.mount_point +'/my_file_name.jpg')

应该可以正常工作。

关于python - 如何访问 azureml FileDataSet 中的文件(图像)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60151965/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com