gpt4 book ai didi

python - 如何训练新的 fast-rcnn 图像集

转载 作者:太空宇宙 更新时间:2023-11-03 12:06:19 32 4
gpt4 key购买 nike

我正在使用 fast-rcnn 并尝试为新类(标签)训练系统我跟着这个:https://github.com/EdisonResearch/fast-rcnn/tree/master/help/train

  1. 放置图片

  2. 放置注释

  3. 准备带有所有图片名称前缀的ImageSet

  4. 准备好的选择性搜索输出:train.mat

我在运行 train_net.py 时失败并出现以下错误:

./tools/train_net.py --gpu 0 --solver models/VGG_1024_pascal2007/solver.prototxt --imdb voc_2007_train_top_5000 

Called with args: Namespace(cfg_file=None, gpu_id=0, imdb_name='voc_2007_train_top_5000', max_iters=40000, pretrained_model=None, randomize=False, solver='models/VGG_1024_pascal2007/solver.prototxt') Using config: {'DEDUP_BOXES': 0.0625, 'EPS': 1e-14, 'EXP_DIR': 'default', 'PIXEL_MEANS': array([[[ 102.9801, 115.9465, 122.7717]]]), 'RNG_SEED': 3, 'ROOT_DIR': '/home/hagay/fast-rcnn', 'TEST': {'BBOX_REG': True,
'MAX_SIZE': 1000,
'NMS': 0.3,
'SCALES': [600],
'SVM': False}, 'TRAIN': {'BATCH_SIZE': 128,
'BBOX_REG': True,
'BBOX_THRESH': 0.5,
'BG_THRESH_HI': 0.5,
'BG_THRESH_LO': 0.1,
'FG_FRACTION': 0.25,
'FG_THRESH': 0.5,
'IMS_PER_BATCH': 2,
'MAX_SIZE': 1000,
'SCALES': [600],
'SNAPSHOT_INFIX': '',
'SNAPSHOT_ITERS': 10000,
'USE_FLIPPED': True,
'USE_PREFETCH': False}} Loaded dataset `voc_2007_train` for training Appending horizontally-flipped training examples... voc_2007_train gt roidb loaded from /home/hagay/fast-rcnn/data/cache/voc_2007_train_gt_roidb.pkl /usr/local/lib/python2.7/dist-packages/numpy/core/fromnumeric.py:2507: VisibleDeprecationWarning: `rank` is deprecated; use the `ndim` attribute or function instead. To find the rank of a matrix see `numpy.linalg.matrix_rank`. VisibleDeprecationWarning) wrote ss roidb to /home/hagay/fast-rcnn/data/cache/voc_2007_train_selective_search_IJCV_top_5000_roidb.pkl Traceback (most recent call last): File "./tools/train_net.py", line 80, in <module>
roidb = get_training_roidb(imdb) File "/home/hagay/fast-rcnn/tools/../lib/fast_rcnn/train.py", line 107, in get_training_roidb
imdb.append_flipped_images() File "/home/hagay/fast-rcnn/tools/../lib/datasets/imdb.py", line 104, in append_flipped_images
assert (boxes[:, 2] >= boxes[:, 0]).all() AssertionError

我的问题是:

  1. 为什么我会遇到这个错误?
  2. 我是否需要在训练前重新缩放图像以修复:256x256?
  3. 我是否需要准备一些东西才能设置 __background__ 类?

最佳答案

  1. 它说存在boxes[:,2] < boxes[:, 0] , boxes[:, 2]是边界框的 x-max 而 boxes[:, 0]是 x 分钟。所以这个问题与region proposal有关。我也遇到过这个问题。我发现这是溢出引起的。我记得盒子的 dtype 是 np.uint8(需要检查),如果图像太大,就会出现此错误。
  2. rescale 是一种解决方案,但这可能会影响性能。您可以将 dtype 从 uint8 更改为 float。
  3. 据我所知,没有这个必要。

关于python - 如何训练新的 fast-rcnn 图像集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31005463/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com