gpt4 book ai didi

deep-learning - 如何使用 GPU 训练数百万个 doc2vec 嵌入?

转载 作者:行者123 更新时间:2023-12-04 07:38:41 25 4
gpt4 key购买 nike

我正在尝试根据用户浏览历史记录(标记为 user_id 的 URL)训练 doc2vec。我使用chainer深度学习框架。

有超过 2000 万个(user_id 和 urls)的嵌入要初始化,这些嵌入不适合 GPU 内部存储器(最大可用 12 GB)。 CPU 上的训练非常缓慢。

我正在尝试使用此处给出的链器编写的代码
https://github.com/monthly-hack/chainer-doc2vec

如果有的话,请建议尝试的选项。

最佳答案

您也可以引用chainer官方word2vec例子。

  • https://github.com/chainer/chainer/tree/master/examples/word2vec

  • 您是否已经尝试过使用 GPU 进行训练?通常只提取batch size的数据到GPU显存,所以总数据数(20M)不影响GPU显存限制。

    关于deep-learning - 如何使用 GPU 训练数百万个 doc2vec 嵌入?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53976127/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com