python - 我的自定义 mobilenet 训练模型未显示任何结果。我究竟做错了什么？-6ren

python - 我的自定义 mobilenet 训练模型未显示任何结果。我究竟做错了什么？

转载作者：太空宇宙更新时间：2023-11-03 20:28:58

我开始使用 Tensorflow/Deeplab 学习 ML。我尝试使用带有 mobilenet_v2 模型变体的语义分割从头开始训练自己的模型进行服装识别。但我没有得到结果。

我正在使用tensorflow/models用于 tfrecord 导出和培训。和deeplab/example用于可视化和测试目的的代码(本地重命名为 main.py)，我修改了一些行，以便可以获得本地模型和测试图像。

我将展示我遵循的过程:

下载 100 张 JPEG 图像(我知道不是那么大，但我想我可以用这个量尝试一下)。仅适用于 1 类 -> 衬衫
为每个图像创建分割类 PNG。
创建以下文件图像集定义:train(85 个文件名)、trainval(100 个文件名)和 val(15 个文件名)。
所以我的“pascal dataset”目录有:ImageSets、JPEGImages 和 SegmentationClassPNG 文件夹。

将“pascal dataset”目录导出到 tfrecord，如下所示(我位于“models-master/research/deeplab/datasets”文件夹中):

py build_voc2012_data.py --image_folder="pasc_imgs/JPEGImages" --semantic_segmentation_folder="pasc_imgs/SegmentationClassPNG" --list_folder="pasc_imgs/ImageSets" --image_format="jpg" --output_dir="train/tfrecord"

这工作正常，它会在“train/tfrecord”上生成 *.tfrecord 文件

我像这样编辑了“models-master/research/deeplab/data_generator.py”:{'train': 85, 'trainval': 100, 'val': 15}, num_classes=2。
现在是时候开始训练了(我在“models-master/research/deeplab”)。我用了 10000 步，为什么？我用 30000 进行了证明，花了大约 30 个小时却没有结果，所以我用新的参数减少了它。我想 10000 步可以告诉我一些东西:
```
py train.py --logtostderr  --training_number_of_steps=10000 --train_split="train" --model_variant="mobilenet_v2" --output_stride=16 --decoder_output_stride=4 --train_batch_size=1 --dataset="pascal_voc_seg"  --train_logdir="datasets/train/deeplab_model_mn" --dataset_dir="datasets/train/tfrecord"
```
- 这一步需要将近 8 个小时(GPU 很小，所以..无法使用它)，它会生成检查点、graph.pbtxt 和 model.ckpt-XXX(包括 10000 个)文件。

我使用以下命令行导出了之前的结果(我在“models-master/research/deeplab”):

py export_model.py --checkpoint_path=datasets/train/deeplab_model_mn/model.ckpt-10000 --export_path=datasets/train/deeplab_inference_mn/frozen_inference_graph.pb --model_variant="mobilenet_v2" --output_stride=16 --num_classes=2

它创建卡住图 (frozen_inference_graph.pb)。

现在运行:py main.py(证明图像和 freeze_inference_graph.pb 已导入)
我的自定义模型没有结果。最后一个脚本适用于预先训练的 mobilenetv2_coco_voc_trainaug。不适用于我的定制模型

data_generator.py(编辑行):

_PASCAL_VOC_SEG_INFORMATION = DatasetDescriptor(
    splits_to_sizes={
        'train': 85,
        'trainval': 100,
        'val': 15,
    },
    num_classes=2,# 0:background, 1:shirt
    ignore_label=255,
)

我用于训练的图像示例 (1/100)(我使用 labelMe 实用程序):
shirt_001.jpg
shirt_001.png

mobilenetv2_coco_voc_trainaug 的 main.py 结果(衬衫作为一个人，没关系)和我的自定义模型:
mobilenetv2_coco_voc_trainaug result
my custom model result

如您所见，我的模型失败了。我已经测试了很多组合但没有成功。 我该怎么办？谢谢!

最佳答案

好吧，我也遇到了同样的问题，经过多次尝试，我已经做到了。首先，你应该制作正确的口罩。如果您使用一个类，您应该使用索引颜色图创建蒙版，并且所有像素应为 0 或 1，0 - 背景，1 - 蒙版(有 255 个)索引颜色图中的颜色)。其次，您需要更大的数据集。我尝试使用包含约 200 个图像的数据集进行训练，但即使在 checkpoint-30k 上也没有得到任何结果(即使使用正确的数据集)。但当我尝试使用包含 450 张图像的数据集进行训练时，我只得到了约 9000 个时期的一些结果。在~18000 epoch 之后没有任何改进，但结果是合理的(尽管远非理想)。然后我用 1100 张图像训练模型，但结果是一样的。

关于python - 我的自定义 mobilenet 训练模型未显示任何结果。我究竟做错了什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57642245/

文章推荐： html - 放置 tr :nth-child(even) inside a table tag

文章推荐： c# - 更新自动计算的属性的绑定(bind)

文章推荐： html - 文本区域不可编辑/无法在文本区域中键入文本

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 我的自定义 mobilenet 训练模型未显示任何结果。我究竟做错了什么？