gpt4 book ai didi

java - 在模型运行时显示 ELKI DBSCAN 聚类模型的进度?

转载 作者:行者123 更新时间:2023-12-02 10:24:16 24 4
gpt4 key购买 nike

我正在使用 ELKI 的 DBSCAN 实现来聚类不同大小的不同数据集(从数百万到数千个观测值),并且由于当我运行该算法时,不同的数据集可能需要相当长的时间,我想知道它是否以某种方式是否可以显示算法的进度(或良好的估计)?

我尝试在 ELKI 文档中查找 Clustering Class,但没有成功。

private static Clustering<Model> runModel(double eps, int minpts, Database db){

//double eps = 10;
//int minpts = 5;
//db = data in a double[][] format;

Clustering<Model> c = new DBSCAN<NumberVector>(
EuclideanDistanceFunction.STATIC, eps, minpts).run(db);

return c;
}

我希望用这种方法定期写入控制台。或者以任何方式我能够看到算法的进展。

最佳答案

是的。

如果您使用-verbose标志,日志记录将包括进度。

以编程方式,您可以使用 LoggingConfiguration 设置详细级别。

并非适用于所有算法,但适用于许多算法;包括 DBSCAN。进度记录还将包括剩余时间的估计。

请注意,日志记录不是免费的 - 它需要额外的努力,因此可能会导致程序运行更长时间。详细应该是合理的(并且进度日志记录包括限制成本的速率控制),但在调试级别它可能会变得太昂贵。

要减少运行时间,请确保向数据库添加索引。

关于java - 在模型运行时显示 ELKI DBSCAN 聚类模型的进度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54091747/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com