gpt4 book ai didi

python - gensim TransformedCorpus 数据到数组的高效转换

转载 作者:行者123 更新时间:2023-12-04 16:46:38 28 4
gpt4 key购买 nike

有没有比下面的 by-row 方法更直接或更有效的方法从 gensim.interfaces.TransformedCorpus 对象中获取主题概率数据到 numpy 数组(或者,pandas 数据帧)?

from gensim import models
import numpy as np

num_topics = 5
model = models.LdaMulticore(corpus, num_topics=num_topics, minimum_probability=0.0)

all_topics = model.get_document_topics(corpus)
num_docs = len(all_topics)

lda_scores = np.empty([num_docs, num_topics])

for i in range(0, num_docs):
lda_scores[i] = np.array(all_topics[i]).transpose()[1]

最佳答案

可能为时已晚,但 gensim 有一个辅助函数用于在 numpy/scipy 数组之间进行转换。

你在找什么:

gensim.matutils.corpus2csc

然后,您可以根据需要将输出转换为 numpy 数组或 pandas df。

import gensim
import numpy as np

all_topics_csr = gensim.matutils.corpus2csc(all_topics)
all_topics_numpy = all_topics_csr.T.toarray()

关于python - gensim TransformedCorpus 数据到数组的高效转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48358161/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com