gpt4 book ai didi

machine-learning - 什么是多头模型?模型中的 'head' 到底是什么?

转载 作者:行者123 更新时间:2023-11-30 08:24:37 26 4
gpt4 key购买 nike

什么是深度学习中的多头模型?

到目前为止我发现的唯一解释是:每个模型都可以被认为是 Backbone 加一个头,如果你预先训练 Backbone 并放置一个随机头,你可以对其进行微调,它是好主意
有人可以提供更详细的解释吗?

最佳答案

您找到的解释是准确的。根据您想要对数据进行预测的内容,您需要足够的 Backbone 络和一定数量的预测头

例如,对于基本分类网络,您可以将 ResNet、AlexNet、VGGNet、Inception...视为主干,将全连接层视为唯一的预测头。

对于需要多头的问题,定位是一个很好的例子,您不仅想要对图像中的内容进行分类,还想要定位对象(找到它周围的边界框的坐标)。

下图展示了总体架构 enter image description here

主干网络(“卷积和池化”)负责从包含更高级别汇总信息的图像中提取特征图。每个头都使用此特征图作为输入来预测其所需的结果。

您在训练期间优化的损失通常是每个预测头的各个损失的加权和。

关于machine-learning - 什么是多头模型?模型中的 'head' 到底是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56004483/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com