keras - 如何将 Bert 嵌入提供给 LSTM-6ren

keras - 如何将 Bert 嵌入提供给 LSTM

转载作者：行者123 更新时间：2023-12-03 19:30:06

25

4

我正在研究用于文本分类问题的 Bert + MLP 模型。本质上，我试图用基本的 LSTM 模型替换 MLP 模型。

是否可以创建带有嵌入的 LSTM？或者，最好创建一个带有嵌入层的 LSTM？

更具体地说，我很难尝试创建嵌入矩阵，因此我可以使用 Bert 嵌入创建嵌入层。

def get_bert_embeddings(dataset='gap_corrected_train',
                        dataset_path=TRAIN_PATH,
                        bert_path=BERT_UNCASED_LARGE_PATH,
                        bert_layers=BERT_LAYERS):
    """Get BERT embeddings for all files in dataset_path and specified BERT layers and write them to file."""
    df = None
    for file in os.listdir(dataset_path):
        if df is None:
            df = pd.read_csv(dataset_path+'/'+file, sep='\t')
        else:
            next_df = pd.read_csv(dataset_path+'/'+file, sep='\t')
            df = pd.concat([df, next_df], axis=0)
            df.reset_index(inplace=True, drop=True)

    for i, layer in enumerate(bert_layers):
        embeddings_file = INTERIM_PATH + 'emb_bert' + str(layer) + '_' + dataset + '.h5'
        if not os.path.exists(embeddings_file):
            print('Embeddings file: ', embeddings_file)
            print('Extracting BERT Layer {0} embeddings for {1}...'.format(layer, dataset))
            print("Started at ", time.ctime())

            emb = get_bert_token_embeddings(df, bert_path, layer)
            emb.to_hdf(embeddings_file, 'table')

            print("Finished at ", time.ctime())

def build_mlp_model(input_shape):
    input_layer = layers.Input(input_shape)



    input_features = layers.Input((len(FEATURES),))
    x = layers.Concatenate(axis=1, name="concate_layer")([input_layer, input_features]) 


    x = layers.Dense(HIDDEN_SIZE, name='dense1')(x)
    x = layers.BatchNormalization()(x)
    x = layers.Activation('relu')(x)
    x = layers.Dropout(DROPOUT, seed=RANDOM)(x)

    x = layers.Dense(HIDDEN_SIZE//2, name='dense2')(x)
    x = layers.BatchNormalization()(x)
    x = layers.Activation('relu')(x)
    x = layers.Dropout(DROPOUT//2, seed=RANDOM)(x)

    x = layers.Dense(HIDDEN_SIZE//4, name='dense3')(x)
    x = layers.BatchNormalization()(x)
    x = layers.Activation('relu')(x)
    x = layers.Dropout(DROPOUT//2, seed=RANDOM)(x)

    output_layer = layers.Dense(3, name='output', kernel_regularizer = regularizers.l2(LAMBDA))(x)
    output_layer = layers.Activation('softmax')(output_layer)

    model = models.Model(input=[input_layer, input_features], output=output_layer, name="mlp")
    return model

最佳答案

您可以创建首先使用 Embedding 层，然后是 LSTM 然后是 Dense 的模型。
比如这里:

deep_inputs = Input(shape=(length_of_your_data,))
embedding_layer = Embedding(vocab_size, output_dim = 3000, trainable=True)(deep_inputs)
LSTM_Layer_1 = LSTM(512)(embedding_layer) 
dense_layer_1 = Dense(number_of_classes, activation='softmax')(LSTM_Layer_1) 
model_AdGroups = Model(inputs=deep_inputs, outputs=dense_layer_1)

关于keras - 如何将 Bert 嵌入提供给 LSTM，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55669695/

25

4

0

文章推荐： angular - SELECT的表单控件不会在选项列表更改时更新值

文章推荐： apache-flink - 如何将 Apache Flink 与查找数据一起使用？

java - 具有默认安全性的 Spring Security 为 PUT 提供 401，为 GET 提供 200
我开发了一个具有基本安全性的 Spring Boot 应用程序。我有两个具有相同路径和不同 http 方法的端点。当我使用默认密码/使用 application.yml 中给出的密码包含基本安全性时，
html - 如何向 Firefox 3.6 提供 OGG 视频和向 Firefox 4 提供 WEBM 视频？
我的代码是这样的: 或者，像这样: 如果我首先列出 webm 源，Firefox 4 会播放它，但 Firefox 3.6 也会尝试播放它(但会失败，因为它不支持 webm)。
TypeScript 提供(未指定的)泛型类型作为泛型参数
我希望提供一个泛型类型作为类型参数而不首先将其解析为具体类型。换句话说，我正在寻找一种方法来指定从基类继承时可以使用的类型映射函数。示例(不正确的)语法，希望比我能解释得更好: abstract c
.net - 提供 GUI 和命令行界面的应用程序的程序集名称应该是什么？
我在 .NET 中编写了一些桌面应用程序，它们既提供了用于正常使用的前端 GUI，也提供了用于其他需求(例如扩展、调度、自动化、高级使用等)的命令行界面。命名两个可执行文件的最佳做法是什么，因为它们构
json - 提供 API 是否有助于阻止屏幕抓取？
我最近在这里思考了很多关于屏幕抓取以及它可能是一项什么样的任务。所以我提出以下问题。作为网站开发人员，您是否会公开简单的 API 以防止用户抓取屏幕，例如 JSON 结果？然后这些结果可以实现缓存
dojo - 更新 Dojo 提供
我正在为一个项目使用 Dojo 1.9，但我不明白 dojo.provide 的正确替代方案与传统风格相比，AMD 风格。我正在阅读 this文档页面。很明显，这就是旧语法映射到新语法的方式: 旧
angular - 提供 Angular 构建时出现非法状态问题中的错误
我正在开发一个 Angular 应用程序。当我使用 ng serve 正常运行它时，它运行没有任何错误.但是，当我运行 ng build --prod ，它给出了以下错误。 ERROR in Ille
cocoa - 提供 Mac 应用程序的打印选项
我有一个 Mac 应用程序。在我的 Mac 应用程序中，我的屏幕之一有一个包含文本字段的 scrollView。在同一屏幕上，我有一个需要提供打印选项的按钮。可以打印文本字段的文本。打印按钮应调用 M
Django:提供 ADMIN 媒体文件
我已经成功地为普通媒体文件提供媒体文件，但是当我尝试提供管理媒体文件时，我失败了。请帮我找出问题所在，因为我已经尝试解决问题几个小时但没有运气(也一直在谷歌搜索并阅读有关提供静态文件的 django
java - 提供 JSON 的错误处理
我正在尝试创建一个简单的错误处理项目，它会在收到错误(例如 404、422 或 500)后为 JSON 提供错误数据。我使用来自 this 的代码网站，但它不适合我。我实际上有这两个类: 基本 Co
java - 提供 equals() 的替代方案吗？
假设我有一个名为 Number 的类(class)，我打算对 Number 进行大量相等比较对象。我担心通用 Number::equals(Object o) 的“开销”(类比较等...)方法。在这种
google-chrome - Webrtc对等连接使用不同的sdpConstraints创建应答/提供
假定以下情况: 对等方A只希望将音频流发送给对等方B 对等B只希望将视频流发送给对等A 从而，与创建报价 var sdpConstraints = { “必填”:{ 'OfferToReceiveA
c# - 提供 FluentAssertions 的扩展
因为我有一些角度，所以我想检查角度模数 360°: double angle = 0; double expectedAngle = 360; angle.Should().B
haskell - 提供 monad 堆栈的测试实现
这是我的程序中构建的 monad 堆栈: type Px a = ReaderT PConf (State PState) a 其中 PConf 和 PState 是保存应用程序的配置和状态的任意数据
c# - 提供 FluentAssertions 的扩展
因为我有一些角度，所以我想检查角度模数 360°: double angle = 0; double expectedAngle = 360; angle.Should().B
java - 提供 Applet 安全异常的后备方案
我有一个小程序需要以某些权限运行，这意味着加载时会显示一条警告消息。如果用户拒绝警告消息，我想重定向到错误页面并解释发生了什么。有什么办法可以做到这一点吗？我研究过让计时器运行并在特定时间段后重定向
firebase - 提供 Firebase 应用的静态内容
从我可以从 Firebase 文档中推断出，似乎需要服务器来提供静态内容(html和 javascript)，所以你需要有一台托管机器和一个静态内容服务器在某处启动并运行，或某些服务托管静态站点。对
javascript - 提供 UML 作为带有代码的文档是个好主意吗？
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 3 年前。 Improv
python - 提供 django 静态文本文件
我的项目根目录的静态文件夹中有一个文本文件。我想提供它，所以我创建了: @csrf_exempt def display_text(request): content = retur
使用指针连接两个数组(提供 C 代码)
我目前正在研究指针，为了进一步理解我正在尝试使用指针将两个数值数组连接成一个。代码如下所示。 #include void concat(int **pa,int **pb,int **pc) {

首页

博学

6Ren·AI

商城

keras - 如何将 Bert 嵌入提供给 LSTM