python - 如何在 bert 模型上添加 Bi-LSTM 层？-6ren

python - 如何在 bert 模型上添加 Bi-LSTM 层？

转载作者：行者123 更新时间：2023-12-05 00:44:55

25

4

我正在使用 pytorch 并且我正在使用基础 pretrained bert 对仇恨言论的句子进行分类。我想实现一个 Bi-LSTM 层，将最新的所有输出作为输入来自 bert 模型的变压器编码器作为新模型(实现 nn.Module 的类)，我对 nn.LSTM 参数感到困惑。我使用

标记了数据

bert = BertForSequenceClassification.from_pretrained("bert-base-uncased", num_labels=int(data['class'].nunique()),output_attentions=False,output_hidden_states=False)

我的数据集有 2 列:类(标签)、句子。有人可以帮我弄这个吗？提前谢谢你。

编辑:此外，在处理完 bi-lstm 中的输入后，网络将最终隐藏状态发送到使用 softmax 激活函数执行分类的全连接网络。我该怎么做？

最佳答案

你可以这样做:

from transformers import BertModel
class CustomBERTModel(nn.Module):
    def __init__(self):
          super(CustomBERTModel, self).__init__()
          self.bert = BertModel.from_pretrained("bert-base-uncased")
          ### New layers:
          self.lstm = nn.LSTM(768, 256, batch_first=True,bidirectional=True)
          self.linear = nn.Linear(256*2, <number_of_classes>)
          

    def forward(self, ids, mask):
          sequence_output, pooled_output = self.bert(
               ids, 
               attention_mask=mask)

          # sequence_output has the following shape: (batch_size, sequence_length, 768)
          lstm_output, (h,c) = self.lstm(sequence_output) ## extract the 1st token's embeddings
          hidden = torch.cat((lstm_output[:,-1, :256],lstm_output[:,0, 256:]),dim=-1)
          linear_output = self.linear(hidden.view(-1,256*2)) ### assuming that you are only using the output of the last LSTM cell to perform classification

          return linear_output

tokenizer = BertTokenizerFast.from_pretrained("bert-base-uncased")
model = CustomBERTModel()

关于python - 如何在 bert 模型上添加 Bi-LSTM 层？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65205582/

25

4

0

文章推荐： vue.js - Vue路由器导航或滚动到 anchor (# anchor )

文章推荐： raku - 通过 NativeCall 在 Raku 中使用 void 结构

文章推荐： sql - 使用 to_date 作为转换函数的列

文章推荐： tailwind-css - 响应式字体大小 - 插件

excel - 向没有 Power BI 的用户提供 Power BI
所以我问了一个类似的问题，但我想我应该更普遍地提出这个问题，以获得尽可能多的想法。我有 Power BI Pro。我的任务是为数百个收件人创建报告，每个报告都针对该特定用户进行个性化设置。尽管每个
deployment - 以编程方式将 Power BI 报表部署到 Power BI 报表服务器并更改连接字符串
有没有什么方法可以将 Power BI 报表部署到 Power BI 报表服务器，而无需手动复制这些文件，将它们上传到服务器，最后逐个报表更改每个报表的数据源连接信息，这在每个报表中都不实用客户网站。
Java 8，如何从 (Bi)Predicate 组合 (Bi)Function
我不认为这个问题是针对这些 Java 8 类的 Bi 版本的，因此问题标题中有括号。我编写了一个函数来创建具有以下要求的 Apache Commons Lang3 Pair 对象: 如果 Left
azure - Microsoft BI 架构 : Power BI, 分页报表、分析服务和云 - 最佳解决方案是什么？
我正在寻找有关 Microsoft BI 架构的一些意见和建议。需要设计一个支持以下功能的 BI 架构: 自助式 BI - Power BI 思考企业级建模，具有适当的源代码控制、数据安全性和多语言
azure - Microsoft BI 架构 : Power BI, 分页报表、分析服务和云 - 最佳解决方案是什么？
我正在寻找有关 Microsoft BI 架构的一些意见和建议。需要设计一个支持以下功能的 BI 架构: 自助式 BI - Power BI 思考企业级建模，具有适当的源代码控制、数据安全性和多语言
python - 从使用 Power BI 的网站抓取数据 - 从网站上的 Power BI 检索数据
我想从此页面(和类似页面)抓取数据:https://cereals.ahdb.org.uk/market-data-centre/historical-data/feed-ingredients.as
azure - Power Bi Desktop 中的 Power BI Rest Api 数据集
我成功地将 Java 应用程序连接到 Power BI REST API，并成功创建了数据集并添加了一些数据。我可以从 Power BI Web 界面查看这些数据、制作报告、图表等。是否可以将 P
powerbi-embedded - Power BI Premium 和 Power BI Embedded 有什么区别
谁能帮我解释一下 power BI premium 和 power BI Embedded 之间的区别？最佳答案 Power BI Embedded 容量(也称为 SKU)是 billed hour
azure - 如何使用 Power BI API 或 Azure 门户提取所有 Power BI 用户和工作区访问权限？
Power BI 新手。尝试获取有权访问每个仪表板的用户的报告。任何指示都会有帮助。提前致谢! 最佳答案下面是我创建的脚本。首先更改 PowerBI 凭据的用户名和密码。该脚本收集结果，然后打开两
powerbi - 如何将 (.pbix) 报表从 Power BI Desktop 直接发布到 Power BI 报表服务器(本地)
我在“针对 Power BI 报表服务器优化的 Power BI Desktop(2017 年 10 月)”应用程序中创建了一个报表，并希望将其直接部署到本地 Power BI 报表服务器实例，但不能
asp.net-mvc - 获取 Power BI Embedded 的 Azure Power BI 容量的授权代码
我以编程方式启动/停止 PowerBI Embedded 的 Azure PowerBI 容量。单击按钮后，恢复/暂停 Azure 中的 powerbi 嵌入服务。我按照下面的链接执行此操作。 ht
c# - 无法在 Azure Active Directory 中添加 'Power BI Service' 以使用 Power BI API
根据 Microsoft Power BI 开发人员文档 https://msdn.microsoft.com/en-US/library/dn877542.aspx 。我首先需要在 Azure Ac
sql-server - Azure 突触 : What should I do so that I can access the Power BI report on Power BI service without having to enable the "Public Network Access"?
我有一个带有 SQL Server 专用池的 Azure Synapse 工作区并已禁用公共(public)网络访问和加载的数据我可以获取数据我已将数据加载到 Power BI 桌面应用程序中
sql-server - Azure 突触 : What should I do so that I can access the Power BI report on Power BI service without having to enable the "Public Network Access"?
我有一个带有 SQL Server 专用池的 Azure Synapse 工作区并已禁用公共(public)网络访问和加载的数据我可以获取数据我已将数据加载到 Power BI 桌面应用程序中
Bi-encodervsCrossencoder?
本文永久地址：https://wanger-sjtu.github.io/encoder-cross-bi/ Bi-encoder和Cross-encoder是在自然语言理解任务模型的两种不同方法，
Pentaho BI 市场
我正在尝试使用 CDE 对我的仪表板进行一些更改。但是当我以管理员身份访问 Pentaho plateform 5.0 时，我无法在所有菜单中找到 Marketplace谢谢你帮助我! 最佳答案 Ma
powerbi - Power BI DAX函数超过2个或条件
我正在 power BI 中创建角色并按原则代码过滤表 - 比如role1——只能看到CKBD、CKRANP、DA原理的数据，因为我用的是dax函数—— OR([principlecode] = "C
powerbi - power bi 中的计算列不更新结果
我创建了一个简单的仪表板，这是我在 Power bi 中的第一个项目。我创建了一个新列并使用了这个公式 Total Records = CALCULATE(COUNTROWS('Table A'),
powerbi - Power BI 传递参数到报表
我有一个包含多个参数的 Power BI 报表，我需要将报表嵌入网页，并希望通过嵌入 URL 或 Power BI JavaScript 库设置这些参数。这可能吗？从根本上说，我想将一些数据从托管报告
tooltip - Power BI 用户可以访问工具提示滚动条吗
我有一个工具提示，它引用了一个条形图可视化，其中的行数多于一次无法显示的行数。当我将此工具提示应用于报表视觉对象并将鼠标悬停在其上时，我无法在不关闭工具提示本身的情况下单击并拖动滚动条，也无法使用鼠标

首页

博学

6Ren·AI

商城

python - 如何在 bert 模型上添加 Bi-LSTM 层？