gpt4 book ai didi

python - Doc2vec 矩阵表示

转载 作者:太空宇宙 更新时间:2023-11-03 20:28:55 25 4
gpt4 key购买 nike

使用 Doc2vec,我想查看生成的矩阵中每个单词的影响。

有没有办法查看矩阵的详细表示,即矩阵的内容以及每行和每列主要代表什么?

例如,这样我可以看到矩阵表示,但看不到列和行描述:

user_vector = model.infer_vector(doc_words=normalized_code, steps=500, alpha=0.025)
print ('user_vector',user_vector)

('user_vector', array([ 0.24641024, -0.34768087, 0.02094658, -0.06164126, 0.13432615,
-0.22375308, -0.16741623, -0.2827304 , 0.04730519, 0.19883735,
-0.27629316, 0.00847638, 0.03568176, -0.31764287, -0.38039216,
0.08650897, 0.3766149 , 0.09078006, -0.1676072 , -0.1324272 ],
dtype=float32))

最佳答案

作为“密集嵌入”,Doc2Vec(或 Word2Vec)向量的各个维度没有清晰可描述的解释。

向量处于相对位置,非常适合训练任务——幸运的是,对我们来说,这些相同的相对位置可以很好地与我们对单词相似性的感觉,甚至是共同点的“邻域”或“方向”相关联。 -意义。

但是有趣的语义概念,例如著名的 Word2Vec 捕获的“皇家领袖”或“性别”概念 vec['king'] - vec['man'] + vec ['woman'] ~close-to~ vec['queen'] 示例,未与精确的尺寸/轴对齐。

因此,您看到的“行”只是单个向量的所有维度,每个“列”都是与任何其他维度相同的维度,并且通常不可标记。

(如果您要使用几个不同的单词合成一个新的、相似的文档,它会得到一个不同的文档向量 - 但移位可能不会严格限制于任何几个维度。)

关于python - Doc2vec 矩阵表示,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57644159/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com