gpt4 book ai didi

python - 计算word2vec模型的perplexity

转载 作者:太空宇宙 更新时间:2023-11-04 02:10:49 26 4
gpt4 key购买 nike

我在 50 万个句子(约 6 万个)单词上训练了 Gensim W2V 模型,我想计算困惑度。

  1. 这样做的最佳方式是什么?
  2. 对于 60K 字,我如何检查合适的数据量?

谢谢

最佳答案

如果要计算perplexity,首先要找回loss。在 gensim.models.word2vec.Word2Vec 构造函数中,传递 compute_loss=True 参数 - 这样,gensim 将为您存储损失,同时训练。训练完成后,您可以调用 get_latest_training_loss()恢复损失的方法。

由于 skip-gram 模型的交叉熵损失中的损失,损失的 2 次方会给你带来困惑。 (2**损失)

关于python - 计算word2vec模型的perplexity,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53765598/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com