gpt4 book ai didi

machine-learning - 为什么 Bert 格式需要一次性列?

转载 作者:行者123 更新时间:2023-11-30 09:16:02 26 4
gpt4 key购买 nike

我最近遇到了 Bert(来自 Transformers 的双向编码器表示)。我看到Bert对训练数据有严格的格式要求。所需的第三列描述如下:

第 3 列: 全部相同字母的列 — 这是一个一次性的列,您需要包含它,因为 BERT 模型需要它。

什么是一次性列,为什么数据集中需要此列,因为它声明包含相同的字母?

谢谢。

最佳答案

BERT 针对两项任务进行了预训练 - 掩码语言建模和下一句预测。

您所说的第三列仅用于下一句预测和需要多个句子的下游任务(例如问答)。在这些情况下,列的值不会只是 A 或 0。句子1全为0,句子2全为1,表示前者是句子A,后者是句子B。

关于machine-learning - 为什么 Bert 格式需要一次性列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55910635/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com