gpt4 book ai didi

java - 无法理解 MALLET 中的 HLDA 输出

转载 作者:行者123 更新时间:2023-12-02 03:31:03 25 4
gpt4 key购买 nike

下面是我的代码片段:

HierarchicalLDA hlda = new HierarchicalLDA();
hlda.initialize(instances, instances, 5, new Randoms());
hlda.estimate(1000);
hlda.printState(new PrintWriter(new File("Data.txt")));

我无法理解控制台输出的含义以及“Data.txt”文件中打印的内容。我已经浏览过 MALLET 网站,但没有发现任何有用的信息。任何帮助或建议将不胜感激。提前致谢!

最佳答案

在 hLDA 中,每个文档都会对主题树的路径进行采样。每个标记都存在于该路径的一个“级别”上。 printState 方法为您提供文档路径中每个树节点的 id,后跟有关单词的信息:单词的数字 ID、该 id 的字符串以及文档中的级别。路径。

    node = documentLeaves[doc];
for (level = numLevels - 1; level >= 0; level--) {
path.append(node.nodeID + " ");
node = node.parent;
}

for (token = 0; token < seqLen; token++) {
type = fs.getIndexAtPosition(token);
level = docLevels[token];

// The "" just tells java we're not trying to add a string and an int
out.println(path + "" + type + " " + alphabet.lookupObject(type) + " " + level + " ");
}

关于java - 无法理解 MALLET 中的 HLDA 输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38088972/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com