gpt4 book ai didi

python-3.x - 如何将 Parquet 文件中的图像数据和csv文件中的标签加载到fastai

转载 作者:行者123 更新时间:2023-11-30 09:39:58 25 4
gpt4 key购买 nike

我正在尝试在 https://www.kaggle.com/c/bengaliai-cv19 中使用 fastai 库但找不到任何有关从 parquet 文件加载图像的文档。

我已将 parquet 文件转换为 dataFrame,并且 ImageDataBunch 需要参数 path,但图像已经在 dataFrame 中,如何将其加载到 ImageDataBunch 中。

最佳答案

您可以循环遍历数据框并将图像保存到文件夹中,然后使用 ImageDataBunch 类的 from_folder 工厂函数。

根据 Kaggle 网站的数据描述,parquet 文件的每一行都是形状 137 x 236 的测试图像。

  image_id    0    1    2    3    4    5    6    7    8  .....
0 Test_0 247 253 253 252 252 252 252 253 253 .....
1 Test_1 253 253 253 253 253 253 253 253 253 .....
2 Test_2 253 253 253 253 253 252 251 252 252 .....
.
.
.
.

我已经尝试过这个方法来获取第一张图像。

# get the image
>>> img = df.iloc[1,1:].to_numpy().astype(int).reshape(137,236)
>>> img.shape
(137, 236)

# Image_id
>>> df.iloc[1,0]
'Test_1'

希望有帮助!

关于python-3.x - 如何将 Parquet 文件中的图像数据和csv文件中的标签加载到fastai,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59447557/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com