gpt4 book ai didi

nlp - 关于 BertForMaskedLM

转载 作者:行者123 更新时间:2023-12-05 04:50:59 24 4
gpt4 key购买 nike

我最近阅读了有关 Bert 的内容,并想将 BertForMaskedLM 用于 fill_mask 任务。我了解 Bert 架构。另外,据我所知,BertForMaskedLM 是从 Bert 构建的,顶部有一个语言建模头,但我不知道语言建模头在这里是什么意思。谁能给我一个简短的解释。

最佳答案

正如您正确理解的那样,BertForMaskedLM 使用语言建模 (LM) 头。

一般来说,在这种情况下,LM head 是一个线性层,具有隐藏状态的输入维度(对于 BERT-base,它将是 768)和词汇量大小的输出维度。因此,它将 BERT 模型的隐藏状态输出映射到词汇表中的特定标记。损失是根据给定 token 相对于目标 token 获得的分数计算的。

关于nlp - 关于 BertForMaskedLM,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67097467/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com