- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
上下文:假设我已经在 datasetA
上训练了 CNN,并且获得了 caffeModelA
。
当前情况:新图片到达,因此我可以构建新的数据集,datasetB
问题:这两种情况会导致相同的 caffemodel 吗?
datasetA
和datasetB
并从头开始训练网络。datasetB
上训练现有 caffeModelA
,对现有 caffeModelA 进行一些微调(如下所述:http://caffe.berkeleyvision.org/gathered/examples/finetune_flickr_style.html)这似乎是一个愚蠢的问题,但我不太确定它的答案。这非常重要,因为如果两个近似值得出相同的结果,我可以通过执行数字 2 来节省时间。
注意:请记住,这是同一个问题,因此无需更改此处的架构,我只是计划在训练中添加新图像。
最佳答案
在闪烁式示例中,情况更为通用。他们使用针对不同分类任务训练的模型的第一层权重,并将其用于新任务,仅训练新的最后一层并对第一层进行一些微调(通过为那些预训练层设置较低的学习率) )。您的情况类似但更具体,您希望使用预训练模型来训练完全相同的任务的确切架构,但需要扩展数据。
如果您询问选项 1 是否会生成与选项 2 完全相同相同的模型(所有生成的权重相等)。那么不会,很可能不会。
在选项 2 中,网络先针对数据集 A
进行迭代训练,然后针对数据集 B
进行迭代训练,然后再次针对数据集 A
进行训练......依此类推(假设两者只是连接在一起)。在选项 1 中,将在数据集 A
上对网络进行一些迭代/历元的训练,然后继续仅在数据集 B
上学习迭代/历元,仅此而已。因此,求解器将在两个选项中看到不同的梯度序列,从而产生两个不同的模型。这是从严格的理论角度来看的。
如果从实际角度出发,这两个选项最终可能会得到非常相似的模型。您在数据集 A
上训练了多少epoch(不是迭代)?比如说 N epoch,那么您可以安全地使用选项 2。并在数据集 B
上进一步训练您的现有模型,以获得相同数量的epoch,并且相同的学习率和批量大小。
关于machine-learning - Caffe 微调与从头开始,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35196307/
// Assuming that data are on the CPU initially, and we have a blob. const Dtype* foo; Dtype* bar;
我计划使用 NYU depth v2 数据集实现一个 CNN,它可以从单个图像估计深度。通过本教程,我了解到在 Caffe 上实现处理分类问题的 CNN 很容易。我很好奇 Caffe 是否适合涉及多维
我用图像训练了一个模型。现在想将 fc-6 功能提取到 .npy 文件中。我正在使用 caffe.set_mode_gpu() 运行 caffe.Classifier 并提取特征。 而不是每帧提取和保
我通过 apt install 命令在我的 Ubuntu v18 VM 上安装了 caffe-cpu。我正在努力找出安装目录所在的位置,如果我错了请纠正我,但我相信没有安装目录。我尝试执行的 NN 模
这个问题在这里已经有了答案: how to calculate a net's FLOPs in CNN [closed] (4 个回答) 4年前关闭。 我在tensorflow tutorial看到
似乎this related PR现在已经死了,有没有解决方法可以使用 early stopping在咖啡厅?也许在 Caffe 之上使用 Python? 最佳答案 第一部分很容易手动完成:让我们监控
当我尝试在MacbookPro(El Capitan)上安装最新的caffe时,出现以下错误。怎么了?如何解决? 我在此网站上发现了一些类似的问题,不幸的是显示的修复似乎是ubuntu特有的。 先感谢
average_loss有什么用?有人可以举一个例子或用外行的术语解释吗? 最佳答案 您可以登录 caffe.proto文件。当前版本中的第 151 行对 average_loss 给出了以下注释:
我想先分别处理不同类型的数据,然后将它们融合到一个公共(public)层中。这在 Caffe 中是否可行,如果可以,最好的方法是什么? 我读过可以在同一个 prototxt 文件中定义多个数据层。但是
我正在尝试将几个底部 Blob 合并为一个顶部 Blob ,然后将其馈送到下一层。 这些 Blob 来自不同的卷积/FC层,因此它们的形状不同。 我尝试了 concat 层,但使用轴 0 或 1 时,
包 Digits 需要使用 Caffe 安装目录的位置设置环境变量。 安装Caffe的简单方法是apt-get install caffe-cuda .但是,我无法弄清楚它的安装位置。没有安装在hom
我在 Caffe 中训练过 imagenet。现在我正在尝试为我的模型和 caffe 提供的训练模型计算 ROC/AUC。我有两个问题: 1) ROC/AUC 主要用于二进制类,但我也发现在某些情况下
我正在尝试使我的 Caffe 代码适应 tensorflow。我想知道将我的 train.txt 和 test.txt 转换为适用于 tensorflow 的最佳方法是什么。 在我的 train.tx
有没有办法安装/运行修改后的 Caffe 项目,例如 SegNet或FCN-Berkley-Vision在 Windows 上? 有Microsoft-led project to bring Caf
我想用python设置一个caffe CNN,使用caffe.NetSpec()界面。虽然我看到我们可以把测试网放在 solver.prototxt , 我想写在model.prototxt具有不同的
我有一个预训练的 faster-rcnn caffemodel。我可以使用 net.params[pr][0].data 获取模型的权重。到目前为止,权重是 numpy float32 类型。我想将它
我正在做一个将 keras json 模型转换为 caffe prototxt 的项目 caffe 支持任意填充值 keras(在 tensorflow 之上)支持“相同”和“有效”值 对于 caff
我正在尝试让 CaffeOnSpark 在本地运行,并且我按照 CaffeOnSpark wiki 上的此过程进行操作:https://github.com/yahoo/CaffeOnSpark/wi
我通过caffe使用我自己的数据集训练了网络,现在我想用C++写一个分类代码。我的机器 (linux) 仅适用于 CPU! (我使用 GPU 在 VM 中训练网络)。 当我尝试“包含”特定的 Caff
我知道可以(以编程方式)使用 caffe.Netspec() 设计一个网络,基本上主要目的是编写它的 prototxt。 net = caffe.NetSpec() .. (define) .. wi
我是一名优秀的程序员,十分优秀!