- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在对西类牙推文进行情感分析。
在查阅了一些最近的文献后,我发现最近有一项专门针对西类牙语文本 (roberta-base-bne
) 训练 RoBERTa 模型的努力。到目前为止,它似乎比当前最先进的西类牙语模型表现更好,BETO .
RoBERTa 模型已经针对各种任务进行了训练,其中不包括文本分类。
我要拿这个RoBERTa model并对其进行微调以进行文本分类,更具体地说,是情感分析。
我已经完成了所有的预处理并创建了数据集对象,并希望对模型进行 native 训练。
代码
# Training with native TensorFlow
from transformers import TFRobertaForSequenceClassification
model = TFRobertaForSequenceClassification.from_pretrained("BSC-TeMU/roberta-base-bne")
optimizer = tf.keras.optimizers.Adam(learning_rate=5e-5)
model.compile(optimizer=optimizer, loss=model.compute_loss) # can also use any keras loss fn
model.fit(train_dataset.shuffle(1000).batch(16), epochs=3, batch_size=16)
问题
TFRobertaForSequenceClassification
:
AutoModelForMaskedLM
型号卡中指定。
TFRobertaForSequenceClassification
,暗示它会自动将训练好的(和预训练的)知识应用到新任务中,即文本分类?
最佳答案
模型卡中的模型引用了模型所训练的基本内容。如果您熟悉不同建模任务的架构选择(例如,标记分类与序列分类),应该清楚这些模型的布局略有不同,特别是在 Transformer 输出层之后的层中。对于标记分类,这是(一般来说)Dropout 和一个额外的线性层,从 hidden_size
映射模型的输出类的数量。见 here以 BERT 为例。
这意味着使用不同学习目标预训练的模型检查点将 不是 为最后一层设置权重,但您可以在微调期间训练这些(相对较少)参数。事实上,对于 PyTorch 模型,您通常会在加载可用权重略有不同的模型检查点时收到警告:
Some weights of the model checkpoint at
bert-base-uncased
were not used when initializingBertForSequenceClassification
: [...]
BertForSequenceClassification
,这是预期的从在另一个任务上或使用另一个架构训练的模型的检查点(例如,从 BertForSequenceClassification
模型初始化 BertForPreTraining
模型)。 [...] TokenClassification
的标签数量。层有。您可以通过在加载模型期间指定它来执行此操作:
from transformers import TFRobertaForSequenceClassification
roberta = TFRobertaForSequenceClassification.from_pretrained("BSC-TeMU/roberta-base-bne",
num_labels=<your_value>)
关于python - 针对不同的任务、情感分析对预训练的西类牙 RoBERTa 模型进行微调,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69353325/
我正在使用reactjs-popup,它的 Prop 之一是contentStyle,它允许您传递css-in-js对象来设置库中内部div的样式。 但是,当我传递带有 @media 的 css 对象
在查看了一些服务/工具之后,我得出了一个结论。大多数 Text-to-Speech 工具的技术含量太高、太机械化——换句话说,就是质量差的 c 语音。 是的,最重要的是,看起来它们带有“硬编码”语音模
我正在尝试使用 Emotion.sh在我的 React 测试元素中,但我使用与 example 中相同的代码得到以下错误 需要考虑的可能有冲突的事情:1、之前用的是npm,现在用的是yarn;2. 我
通过以下链接,我有了一些想法。我想问问我是做对了还是做错了。如果我走错了路,请指导我。 链接 Using libsvm for text classification c# How to use li
以下设置不显示background-image。作为调试步骤,我尝试在 const background 中设置 background: pink,这确实有效,确认 emotion 正在正确运行。 打
我有一个 data.frame,其中包含周数 week 和文本评论 text。我想将 week 变量视为我的分组变量,并对它运行一些基本的文本分析(例如 qdap::polarity)。一些评论文本有
我正在研究 Kaggle 电影情感分析,我发现电影评论已使用 Standford Parser 进行了解析。在探索数据集时,我发现相同的语句给出了不同的设置- their parents , wise
我正在尝试使用Affectiva emotion sdk 制作一个演示程序。但是,当我调用 detector.setLicensePath() 时,会抛出一个异常(见下图)。有谁知道如何解决这个问题?
我想设置一个使用 Material-UI v4.11.4 的 Typescript 项目来使用情感进行样式设置,为 MUI v5 版本做准备。目标是在项目中引入情感,以便开发人员可以开始使用新样式,而
我是一名优秀的程序员,十分优秀!