gpt4 book ai didi

python - 如何保存一个热编码器?

转载 作者:行者123 更新时间:2023-12-02 11:56:04 24 4
gpt4 key购买 nike

我正在尝试从 keras 保存一个热编码器,以便在不同的文本上再次使用它,但保持相同的编码。

这是我的代码:

df = pd.read_csv('dataset.csv ')
vocab_size = 200000
encoded_docs = [one_hot(d, vocab_size) for d in df.text]

如何保存此编码器并稍后再次使用?

我找到了this在我的研究中,但 one_hot() 似乎是一个函数而不是一个对象(抱歉,如果这是完全错误的,我对 python 相当陌生)。

最佳答案

为了社区的利益,在本节中提及答案(尽管它出现在评论部分中)。

要保存编码器,您可以使用以下代码:

import pickle
with open("encoder", "wb") as f:
pickle.dump(one_hot, f)

然后要加载保存的编码器,请使用以下代码:

encoder = pickle.load(f) 
encoded_docs =[encoder(d, vocab_size) for d in df.text]

由于函数 from.keras.preprocessing.text import one_hot 使用 hash() 生成准唯一编码,因此我们需要使用 HashSeed 用于重现我们的结果(即使多次执行后也能得到相同的结果)。

在终端中运行以下代码,用于设置HashSeed:

enter image description here

关于python - 如何保存一个热编码器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58185671/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com