c++ - 没有lmdb的Caffe+Opencv-6ren

c++ - 没有lmdb的Caffe+Opencv

转载作者：塔克拉玛干更新时间：2023-11-02 23:26:51

24

4

当使用 caffe 时，要创建包含图像的训练数据集，我们需要创建特殊格式的数据库，如 lmdb，但是可以选择将图像批处理传递给 caffe，例如 vector<cv::Mat> ？

澄清一下，我正在寻找可以处理内存无法容纳的大量图像的解决方案(但假设一个训练批处理(包含例如 50 张图像)可以存储在内存中)。

最佳答案

Caffe 可以采用多种类型的输入，具体取决于我们使用的输入层。一些可用的输入法是:

数据
内存数据
HDF5数据
图像数据等

在模型文件中，您找到的第一层是Layer type: Data，它使用lmdb 或leveldb 作为输入方法。将一组图像转换为这些数据库非常容易，因为 Caffe 已经提供了转换图像的工具。

Layer type: MemoryData 直接从内存中读取数据，这在测试阶段使用相机输入作为 Caffe 输入传递时非常有用。强烈不推荐使用这一层进行训练。

Layer type: ImageData 将文本文件作为输入。文本文件包含所有图像名称及其完整路径和类号。 Caffe 使用 OpenCV 读取该层中的图像。它还负责图像的所有转换。因此，建议使用 ImageData，而不是使用 OpenCV 读取图像然后传递到 MemoryData 层。

ImageData层从中读取图像的.txt格式必须是:

/path/to/the/image/imageName.jpg classNumber

强烈建议使用 LMDB 或 LevelDB，因为如果图像路径或名称包含空格，或者任何图像已损坏，ImageData 就无法正常工作。

可以查到各个图层的详细信息here .

根据模型和批量大小在 GPU 中分配内存。如果发生内存溢出，您可以尝试减小批量大小。 Caffe 轻松处理了包含 120 万张图像的 Imagenet 数据库的训练。因此，在最佳批量大小的情况下，该算法应该可以毫无问题地运行。

关于c++ - 没有lmdb的Caffe+Opencv，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33174142/

24

4

0

文章推荐： linux - 使用 grep 提取日志文件中字符串的计数

文章推荐： c++ - 从非常大的文件中解析每四行的最有效方法

文章推荐： linux - rsync 错误权限被拒绝

lmdb - LMDB 中的子数据库有限制吗？
在这里发帖是因为我找不到 lmdb 键值存储的任何论坛。子库有限制吗？并发打开的子数据库的合理数量是多少？我想要大约 200 个数据库，这看起来很多并且清楚地表明我的模型是错误的。我想可以重构每
lmdb - 如何获取 lmdb 环境中的命名数据库列表？
如何获得属于 env 的命名数据库的列表？通过阅读一些 python 绑定(bind)文档 (named database implementation) ，我知道名称存储在主(未命名？)数据库中，但
python - 将 LMDB 复制到另一个 LMDB 可减少文件大小
对现有 lmdb 中的数据进行混洗 ( Trying to solve this problem )。我检索了数据，整理并写回新的 lmdb。但是当我检查 lmdb 文件大小时，它减小了。旧 lmdb
lmdb:如何确定剩余的可用空间？
创建 lmdb 环境时，我可以指定 map 大小。有没有办法在任何时候确定用了多少 map 大小？换句话说，我需要找出剩余多少可用空间才能解决空间不足的问题。我唯一能想到的就是遍历所有数据库并使用
lmdb - LMDB的内部设计有什么特别之处？
内存中 B 树的某些 C++ 实现(例如谷歌 btree)和 LMDB(不考虑 LMDB 的所有功能，例如事务、隔离、共享访问等)之间的性能差异(读/写)是什么？ .)？最佳答案其架构师 Howa
leveldb - LMDB 是否支持多个键到相同值的映射？
是否可以将多个键映射到同一个值？如果没有，是否有解决此功能的方法？最佳答案这是不可能的。我使用的一种解决方法是让第二个键上的值成为指向主键的指针。也就是说，第二个键的值是主键。特别是，我制作了一
c - LMDB 的作案手法
我刚刚开始用 LMDB 替换一些 SQL 表，LMDB 是用 C 实现的基本键值存储 ( lmdb link )。在移植过程中，我遇到了一些理论问题: 数据库使用游标而不是键入的键，我认为这是因为键
serialization - 将字符串或枚举放入 LMDB
我想使用 the lmdb crate 将一些数据写入我的数据库.我正在写一个枚举: enum MyEnum { A { astr: String, bstr: String }, B
linux - 单线程 LMDB
如果您仅从单线程使用 LMDB，并且根本不关心数据库持久性，是否有任何理由打开和关闭事务？在单个事务中执行所有操作会导致性能问题吗？打开和关闭太多事务是否会影响性能？我发现我的 LMDB 数据库在
c++ - LMDB:在有限的内存系统中打开大型数据库
我有一个程序预计会使用几 GB 的 lmdb 磁盘空间(这是一个区 block 链，我们正在远离 leveldb，因为它的缺少 ACID，这是我 future 一些计划所需要的)。是否可以在 Ra
python - 如何将数据附加到现有的 LMDB？
我有大约 100 万张图像要放入此数据集中，每次附加 10000 张。我确信来自此 article 的 ref 的 map_size 是错误的使用这条线来创建集合 env = lmdb.open(
python - 如何在 lmdb 中正确插入重复键？
根据文档 ( https://lmdb.readthedocs.org/en/release/ )，将 dupsort 传递给 open_db() 应该允许将重复键添加到 lmdb 数据库。但情况似乎
java - LMDB Java 检索具有相同键的所有值
我想用同一个键存储多个值。我确保在创建数据库时包含 MDB_DUPSORT 标志。我也知道这限制了值的大小，但在这种特定情况下这不是问题。当我想使用相同的键读取值时，我的问题就开始了。我进行了搜索，
python - 最大 LMDB 值大小
是否有可以插入 LMDB 数据库的最大值大小？我正在尝试将一个 16GB 的文件插入到初始化为 32GB 的 LMDB 中，但我收到此错误: File "build_lmdb.py", line 90
tensorflow - Tensorflow 中的自定义数据读取器 (LMDB)
一般来说，在TF中读取自定义数据我能想到的三种方式: native 实现/自定义数据读取器 https://www.tensorflow.org/versions/r0.10/how_tos/new_
c++ - 无法从 LMDB 获取值
我正在尝试从 LMDB 存储和获取一些数据。数据似乎已存储，我可以看到数据库中的键，但当我尝试使用刚刚存储的相同 ID 获取值时，它会给出 MDB_NOTFOUND 。数据库打开 MDB_e
python - 将非分布式数据库转换为分布式数据库的步骤[具体谈论 lmdb]
我正在处理 lmdb 并且 lmdb 真的很快。但它的一个问题是 lmdb 不是分布式的。每次我需要做一些维护时，lmdb 都必须关闭，并且站点有几个小时不可用。我正在研究如何使 lmdb 成为分布式
c++ - 写入 LMDB 失败
我正在尝试将数据写入 lmdb 数据库(引用来自 caffe/tools/convert_imageset.cpp)。控制台中没有错误，但 .mdb 文件的文件大小保持为零，即没有数据写入文件，但创建
c++ - 使用两个不同 LMDB 的多标签
我是caffe框架的新手，我想用caffe来实现多标签训练。我使用两个 LMDB 分别保存数据和标签。数据 LMDB 的维度为 Nx1xHxW，而标签 LMDB 的维度为 Nx1x1x3。标签是 fl
linux - LMDB windows 数据库的最大大小
当我将最大数据库大小设置为例如 5G 时，在 Windows 上最终的数据库文件大小将变为 5G，即使我只插入一小段数据。但在 Linux 上它工作正常，最终的数据库大小与我插入的数据量有关。这是我

首页

博学

6Ren·AI

商城

c++ - 没有lmdb的Caffe+Opencv