gpt4 book ai didi

machine-learning - 机器学习实践 : Writing algorithms yourself or using Weka?

转载 作者:行者123 更新时间:2023-11-30 08:32:40 25 4
gpt4 key购买 nike

我问自己一个问题:大多数人通常会自己编写机器学习算法,还是可能使用现有的解决方案,例如 Weka 或 R 包。

当然,这取决于问题 - 但假设我想使用像神经网络这样的通用解决方案。还有理由自己编码吗?为了更好地理解这个机制并适应它?还是标准化解决方案的思想更重要?

最佳答案

对于 Stackoverflow 来说这不是一个好问题。这是一个意见问题,而不是一个编程问题。

尽管如此,这是我的看法:

这取决于您想做什么。

  • 如果您想找到哪种算法最适合您手头的数据问题,请尝试 ELKI、Weka、R、Matlab、SciPy 等。尝试您能找到的所有算法,并花更多时间预处理数据。

  • 如果您知道需要哪种算法,并且需要将其投入生产,那么许多工具的性能将不够好,也不够容易集成。相反,请检查是否可以找到提供所需功能的低级库(例如 libSVM)。如果这些不存在,请滚动您自己的优化代码。

  • 如果您想在这个领域进行研究,您最好扩展现有工具。 ELKI 和 Weka 都有 API,您可以插入它们来提供扩展。 R 并没有真正的 API(CRAN 这是一团糟......),但人们只是将他们的代码转储到某个地方并(希望)添加一个如何使用它的手册。扩展这些框架可以为您节省大量精力:您可以使用现成的比较方法,并且可以重用它们的许多代码。例如,ELKI 有很多索引结构来加速算法。大多数时候,索引加速比实际算法更难编写。因此,如果您可以重用现有索引,这也会使您的算法更快(并且您还将受益于这些框架的 future 增强功能)。

  • 如果您想了解现有算法,您最好自己实现它们。您会惊讶地发现,优化某些算法的内容比类里面教授的内容要多得多。例如。先验。基本思想非常简单。但如果所有的修剪细节都正确的话,我说每 20 名学生中就有 1 人能得到这些细节。如果您实现 APRIORI,然后将其与已知的良好实现进行基准测试,并尝试理解为什么您的实现要慢得多,那么您实际上会发现算法的微妙细节。如果看到 ELKI、R、Weka 等之间存在 100 倍的性能差异,请不要感到惊讶 - 它仍然可以是相同的算法,只是在实际使用的数据结构、内存布局等方面或多或少地实现了高效。

关于machine-learning - 机器学习实践 : Writing algorithms yourself or using Weka?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18180745/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com