gpt4 book ai didi

image-processing - Convert_imageset.cpp 指南

转载 作者:行者123 更新时间:2023-11-30 08:20:26 25 4
gpt4 key购买 nike

我对机器学习/python/ubuntu 比较陌生。

我有一组 .jpg 格式的图像,其中一半包含我想要 caffe 学习的功能,一半则不包含。我无法找到将它们转换为所需 lmdb 格式的方法。

我有必要的文本输入文件。

我的问题是任何人都可以提供有关如何在 ubuntu 终端中使用 convert_imageset.cpp 的分步指南吗?

谢谢

最佳答案

Caffe convert_imageset 快速指南

构建

您必须做的第一件事是构建 caffe 和 caffe 的工具(convert_imageset 是其中一个工具)。
安装 caffe 并 make 后,请确保您还运行了 make 工具
验证是否在 $CAFFE_ROOT/build/tools 中创建了二进制文件 convert_imageset

准备数据

图像:将所有图像放入一个文件夹中(我将其称为 /path/to/jpegs/)。
标签:创建一个文本文件(例如,/path/to/labels/train.txt),每个输入图像一行。例如:

img_0000.jpeg 1
img_0001.jpeg 0
img_0002.jpeg 0

在此示例中,第一个图像标记为 1,而另外两个图像标记为 0

转换数据集

在 shell 中运行二进制文件

~$ GLOG_logtostderr=1 $CAFFE_ROOT/build/tools/convert_imageset \
--resize_height=200 --resize_width=200 --shuffle \
/path/to/jpegs/ \
/path/to/labels/train.txt \
/path/to/lmdb/train_lmdb

命令行解释:

  • GLOG_logtostderr 标志在调用 convert_imageset 之前设置为 1,表示将日志消息重定向到 stderr 的日志记录机制。
  • --resize_height--resize_width所有输入图像调整为相同尺寸200x200
  • --shuffle 随机更改图像的顺序,并且不保留 /path/to/labels/train.txt 文件中的顺序。
  • 以下是图像文件夹的路径、标签文本文件和输出名称。请注意,在调用 convert_imageset 之前,输出名称不应存在,否则您会收到可怕的错误消息。

其他可能有用的标志:

  • --backend - 允许您在 lmdb 数据集或 levelDB 之间进行选择。
  • --gray - 将所有图像转换为灰度。
  • --encoded--encoded_type - 将图像数据以编码 (jpg/png) 压缩形式保存在数据库中。
  • --help - 显示一些帮助,查看 Flags from tools/convert_imageset.cpp 下的所有相关标志

您可以查看$CAFFE_ROOT/examples/imagenet/convert_imagenet.sh有关如何使用 convert_imageset 的示例。

关于image-processing - Convert_imageset.cpp 指南,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31427094/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com