gpt4 book ai didi

nlp - Gensim - 使用 GoogleNews 向量模型的内存错误

转载 作者:行者123 更新时间:2023-12-02 08:15:12 27 4
gpt4 key购买 nike

当我使用 GoogleNews-vectors-negative300.bin 或尝试使用带有维基百科数据集语料库的 Gensim 训练模型时出现内存错误。(1 GB)。我的系统中有 4GB 内存。有什么办法可以绕过这个。

我们可以将它托管在像 AWS 这样的云服务上以获得更快的速度吗?

最佳答案

4GB 对于那个向量集来说非常紧张;你应该有 8GB 或更多来加载全套。或者,您可以使用 load_word2vec_format() 的可选 limit 参数来仅加载一些向量。例如,limit=500000 将只加载前 500,000 个(而不是全部 300 万个)。由于该文件似乎将出现频率更高的标记放在首位,因此对于许多用途来说这可能就足够了。

关于nlp - Gensim - 使用 GoogleNews 向量模型的内存错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42673590/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com