gpt4 book ai didi

python - lda[doc_bow] 和 lda.inference(corpus) 之间的区别是什么?

转载 作者:行者123 更新时间:2023-11-28 18:40:15 27 4
gpt4 key购买 nike

我认为在 LDA 模型中,这些是使用现有模型推断新文档的两种方法。这两种方法有什么区别?

最佳答案

我做了一些测试,我的 ldamodel 有 8 个主题,这里是我的结果:2 个预测主题的文档:

list_unseenTw=[['hope', 'miley', 'blow', 'peopl', 'mind', 'tonight', 'gain', 'million', 'fan'],['@mileycyrustour', "we'r", 'think', "it'", 'pretti', 'cool', 'miley', 'saturday', 'night', 'live', 'tonight', '#prettycool']]
  1. 使用 lda[doc_bow] 进行预测(它已经给出了匹配主题的百分比)

    doc_bow = [dictionary.doc2bow(text) for text in list_unseenTw]预测 = ldamodel[doc_bow]

    预测[0]:[(0, 0.02509002728802024), (1, 0.0250114373070437), (2, 0.025040162139306051), (3, 0.82462688228515812), (4, 0.025150924341817767), (5, 0.025000027675139792), (6, 0.025000024127660267), (7, 0.025080514835853926)]

    预测[1]:[(0, 0.031250011319462589), (1, 0.031250013721820222), (2, 0.031250019639505598), (3, 0.031250015093378707), (4, 0.031250019670816337), (5, 0.031250024860739675), (6, 0.78124988084026048), (7, 0.031250014854016454)]

  2. 使用 ldamodel.inference 进行预测(结果以权重而非百分比给出)

    pred= ldamodel.inference(doc_bow)

    打印(预测)

    (数组([[ 0.12545023, 0.1250572 , 0.12520085, 4.12309694, 0.12579184, 0.12500014, 0.12500012, 0.12540268], [ 0.12500005, 0.12500005, 0.12500008, 0.12500006, 0.12500008, 0.1250001 , 3.12499952, 0.12500006]]), 无)

如您所见,第一个预测 (doc1) 的结果与您所做的相同(主题 3):

total=0

for i in pred[0][0]:

total+=i

4.12309694/total = 0.82462%

关于python - lda[doc_bow] 和 lda.inference(corpus) 之间的区别是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27145452/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com