gpt4 book ai didi

machine-learning - Caffe:使用 ImageData 层平衡批处理内的类

转载 作者:行者123 更新时间:2023-11-30 08:52:21 26 4
gpt4 key购买 nike

我正在 Caffe 中训练 CNN,其输出是两个类之一(二元问题)。

我使用 ImageData 层作为输入层,传递两个 .txt 以及图像的训练和验证集。这些文件是平衡的,即,两个类的示例数量相同。在这一层中,我还使用了“shuffle”参数。

对此,我有两个疑问:

<强>1。如何从 .t​​xt 文件中采样/选择批处理?

它是通过获取文件的前 N 个示例(假设 N 是批量大小)、对它们进行洗牌并将它们馈送到网络来构建的吗?从这个意义上说,批处理本身可能不平衡。这会影响训练/微调吗?

另一种方法是从一个类中随机抽取 N/2 个示例,并从另一个类中随机抽取 N/2 个示例,但我不认为 Caffe 会这样做。

<强>2。 .txt 文件中示例的顺序与批处理的构建方式有关吗?

以批处理平衡的方式构建 .txt 文件是一个好主意吗(例如,每个奇数行属于一个类,每个偶数行属于另一个类)?

感谢您的帮助!

最佳答案

(1) 是的,随机播放将随机化输入示例的顺序,假设示例被适本地描述 - 例如使用换行符将句子分成单独的例子。 Caffe 不费心按类别平衡每个批处理。

这对训练有轻微影响,但从长远来看应该会平衡。重要的是让每个示例在每个时期准确地呈现一次。

(2) 预平衡并不重要:随机播放会更改其认为合适的顺序(随机数生成)。

关于machine-learning - Caffe:使用 ImageData 层平衡批处理内的类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39355919/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com