gpt4 book ai didi

python-3.x - 如何存储词向量嵌入?

转载 作者:行者123 更新时间:2023-12-04 16:40:05 26 4
gpt4 key购买 nike

0
我正在使用 BERT Word Embeddings 进行带有 3 个标签的句子分类任务。我正在使用 Google Colab 进行编码。我的问题是,由于每次重新启动内核时我都必须执行嵌入部分,有没有办法在生成这些词嵌入后保存它们?因为,生成这些嵌入需要很多时间。
我用来生成 BERT Word Embeddings 的代码是 -

[get_features(text_list[i]) for text_list[i] in text_list]
在这里,gen_features 是一个函数,它为我的列表 text_list 中的每个 i 返回词嵌入。
我读到将嵌入转换为凹凸不平的张量,然后使用 np.save 可以做到。但我实际上不知道如何编码。
请帮忙。

最佳答案

您可以按照以下步骤将嵌入数据保存到 numpy 文件中:

all_embeddings = here_is_your_function_return_all_data()
all_embeddings = np.array(all_embeddings)
np.save('embeddings.npy', all_embeddings)
如果您要保存到 google colab,则可以将其下载到本地计算机。每当您需要它时,只需上传并加载它。
all_embeddings = np.load('embeddings.npy')
就是这样。
顺便说一句,您也可以直接将文件保存到谷歌驱动器。

关于python-3.x - 如何存储词向量嵌入?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62710872/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com