gpt4 book ai didi

machine-learning - 为什么ELKI除了距离矩阵之外还需要db.in文件?另外 db.in 文件应该包含什么?

转载 作者:行者123 更新时间:2023-11-30 09:38:23 25 4
gpt4 key购买 nike

我尝试按照本教程使用 ELKI 和预先计算的距离进行聚类。

http://elki.dbs.ifi.lmu.de/wiki/HowTo/PrecomputedDistances

我使用了以下一组命令行选项:

-dbc.filter FixedDBIDsFilter -dbc.startid 0 -algorithm clustering.OPTICS 
-algorithm.distancefunction external.FileBasedDoubleDistanceFunction
-distance.matrix /path/to/matrix -optics.minpts 5 -resulthandler ResultWriter

ELkI 失败并出现配置错误,指出需要 db.in 文件来进行计算。

The following configuration errors prevented execution:
No value given for parameter "dbc.in":
Expected: The name of the input file to be parsed.
No value given for parameter "parser.distancefunction":
Expected: Distance function used for parsing values.

我的问题是 db.in 文件是什么?除了距离矩阵文件之外,为什么我还应该提供它,因为成对距离矩阵文件完全指定了有关点云的所有信息。 (此外,除了成对距离信息之外,我无法访问任何其他信息)。

我应该对 db.in 做什么?我应该覆盖它,还是指定一些虚拟信息等。请帮助我理解。

谢谢。

最佳答案

这在 ELKI HowTos 中有记录:

http://elki.dbs.ifi.lmu.de/wiki/HowTo/PrecomputedDistances

Using without primary data

-dbc DBIDRangeDatabaseConnection -idgen.count 100

但是,有一个错误(补丁位于 howto 页面上,并将在下一个版本中出现),因此您现在无法完全使用它;作为解决方法,您可以使用枚举对象的文本文件。

原因是 ELKI 旨在处理多关系数据。它不仅仅是处理矩阵。但有些算法可能例如需要对象的地理表示、该对象的一些测量值以及用于评估的标签。这是三个关系。

DBIDRange 数据源本质上是创建一个单一的“假”关系,即 DBID 0 到 99。对于不需要实际数据而只需要距离的算法(例如 LOF 或 DBSCAN 或 OPTICS),它拥有对象 ID 和距离矩阵就足够了。

关于machine-learning - 为什么ELKI除了距离矩阵之外还需要db.in文件?另外 db.in 文件应该包含什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18730406/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com