gpt4 book ai didi

tensorflow - Mobilenet SSD 输入图像大小

转载 作者:行者123 更新时间:2023-12-03 14:39:28 26 4
gpt4 key购买 nike

我想在自定义数据集上训练 Mobilenet SSD 模型。

我研究了重新训练模型的工作流程,并注意到配置文件中的 image_resizer{} 块:

https://github.com/tensorflow/models/blob/d6d0868209833e014074d6cb4f32558e7acf2a6d/research/object_detection/samples/configs/ssd_mobilenet_v1_pets.config#L43

这里的纵横比是否必须像 300x300 这样的 1:1 或我可以指定自定义比例?

我所有的数据集图像都是 960x256 - 所以我可以输入这个大小的高度和宽度吗?或者我是否需要调整所有图像的大小以使其纵横比为 1:1?

最佳答案

在模型文件(根据您的链接)中选择高度和宽度作为您希望模型训练和操作的输入图像的形状。如果需要,模型会将输入图像的大小调整为指定的大小。

所以这可能是您输入图像的大小(如果您的硬件可以训练和操作该大小的模型):

image_resizer {
fixed_shape_resizer {
height: 256
width: 960
}
}

选择将取决于训练图像的大小以及训练(和使用)该模型大小所需的资源。

我通常使用 512x288,因为这个尺寸的模型可以在 Raspberry Pi 上愉快地运行。我准备了各种比例的训练图像,正好是这个尺寸。所以图像调整器在训练期间不起作用。

对于推理,我以 1920x1080 输入图像,因此图像调整器在它们进入 Mobilenet 之前将它们缩放到 512x288,保持纵横比。

然而,纵横比在我的领域并不重要,因为这种扭曲是自然发生的。

所以是的,只需使用您的训练图像尺寸。

关于tensorflow - Mobilenet SSD 输入图像大小,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48929519/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com