- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在使用 scikit-learn 使用 SVM 构建一些预测模型。我有一个包含大约 5000 个示例和大约 700 个特征的数据集。我在我的训练集上使用 18x17 网格搜索进行 5 折交叉验证,然后使用我的测试集的最佳参数。运行时间比我预期的要长很多,我注意到以下几点:
1) 一些单独的 SVM 训练迭代似乎只需要一分钟,而其他的可能需要长达 15 分钟。这是预期的不同数据和参数(C 和 gamma,我使用的是 rbf
内核)吗?
2) 我正在尝试在 Windows 上使用 64 位 python 来利用额外的内存,但是我的所有 python 进程在我的任务管理器中似乎都以 1 gig 的最高速度运行,我不知道这是否有任何影响处理运行时。
3) 我之前使用的是 32 位,并且在大约相同的数据集上运行,我记得(虽然我没有保存结果)它要快得多。我为 64 位窗口使用了 scikit-learn 的第三方构建,所以我不知道在 32 位 python 上尝试这个是否更好? (来源 http://www.lfd.uci.edu/~gohlke/pythonlibs/)
任何关于如何减少运行时间的建议都将不胜感激。我想减少网格搜索的搜索空间会有所帮助,但由于我什至不确定最佳参数的范围,我希望尽可能大。如果还有更快的 SVM 实现,请告诉我,我可能会尝试一下。
附录:我回去尝试再次运行 32 位版本。由于某种原因,它要快得多。花了大约 3 个小时才到达 64 位版本在 16 小时内到达的位置。为什么会有这样的差异?
最佳答案
1) 这是意料之中的:较小的 gamma 和较小的正则化将选择更多的支持向量,因此模型将更复杂且拟合时间更长。
2) 有一个 cache_size
参数将传递给底层 libsvm 库。但是,根据您的数据,libsvm 可能会也可能不会使用所有可用缓存。
3) 不知道。如果您在两个平台上运行更多定时实验,请在项目邮件列表中报告您的发现。这可能值得进一步调查。
首先检查您是否对特征进行了归一化(例如,如果您的数据是密集的 numpy 数组,则通过方差移除均值和尺度特征)。对于稀疏数据,只需缩放特征(或者对文本数据使用 TF-IDF 转换)。查看preprocessing section的文档。
然后您应该从一个粗略的网格(具有较大的对数步长)开始,比如说一个 3x3 网格,然后通过在该区域重新运行 3x3 网格来关注有趣的区域。一般来说,C x gamma SVM 参数网格是 quite smooth .
关于python - SVM 实现,scikit 学习减少运行时间,最快的 svm,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9163407/
考虑以下示例代码: void main() { List array = []; for (int i = 0; i newList = array.where( (value) => v
我在java中实现了textrank,但它看起来很慢。有谁知道它的预期性能吗? 如果预计速度不会很慢,则可能是以下任一问题: 1) 似乎没有办法在 JGraphT 时间内创建一条边并同时为其添加权重,
我正在尝试提交解决方案(使用一些具有编译时间限制的在线编译器)来对数组进行排序 - 这是我的代码片段 - class TSORT { public static void main(Strin
只是一个困惑......部分C++示例代码如下 我只是重新编辑了整个帖子。抱歉造成任何混淆 int i, j; i = 0; // c1 j = 0; // c2 while (i
我正在使用 OpenMP 运行一些并行工作,但发现加速无法很好地扩展。然后我发现随着线程数量的增加,完成相同工作量的时间也会增加。这是示例: void fillingVec(vector& vec)
我目前正在分析 maximum subarray problem 用于强力算法和分而治之算法(递归)。 使用蛮力算法,最坏情况下的运行时间为 O(n^2)。使用递归算法,最坏情况下的运行时间为 O(n
如果我有两个数组都有 10000 个项目,现在我想将它们合并到一个数组中,所以我用 concat 来完成: array1=array1.concat(array2); 但是有人知道运行时间是多少吗?
{ clock_t t1, t2; double time1 = 0; t1 = clock(); bubbleSort(data, n); t2 = cloc
我在某处读到有人可以在运行时访问配置值,但不能在设计时访问。在这种情况下,运行时和设计时有什么区别? 最佳答案 设计时间是有人用愉快的“看起来不错!”在我们的 Word 文档和 UML 图表上签字的时
我正在比较我们一个项目的两个分支的性能,一个比另一个慢得多。我注意到其中一个的 GC 运行计数更高(见下图)。 更有趣的是,运行时间要长很多倍,远远超过额外运行所能解释的时间。什么可以解释运行次数增加
我想以可读的方式格式化 log4j 经过的运行时间,%r 参数: [00:36:25.844] 和 [01 13:35:25.844] [时:分:ss.SSS] ... [dd 时:分:ss.SSS]
如何计算此代码的大 O 运行时效率?我的直觉告诉我它是 O(n^3),但我不确定,因为我不确定循环是独立的还是相关的。 for (i=1; i<=n; i++) for (j=1; j<=n;
确定这些不同循环的大 O 运行时间? for i = 1 to n { ... for j = 1 to 2*i { ... k = j; while (k>=0)
运行时间、复杂性、编译时间和执行时间有什么区别? 运行时间与时间复杂度有冲突,执行时间和执行时间有什么区别? 最佳答案 您真正需要的是如何将大O时间复杂度转换为运行时。这不像一开始看起来那么容易。 因
斯内普的《Unfriendly Algorithms for Wizards》教科书声称合并的运行时间排序是 O(n^4)。这种说法是否正确? 解决方案:是的。这个说法在技术上是正确的,因为 O(n^
我有一系列问题需要反馈和答案。我会评论我的想法,这不是家庭作业而是准备为了我的考试。 我的主要问题是确定不同情况下循环的迭代。试图弄清楚这一点会如何? 评估运行时间。 Q2。 for(int i =
我试图找到一个合理的机会来测量我的 java 程序/程序部分的速度,例如测试两种方法中哪一种执行得更快。注释掉这两种方法中的一种,确定运行时间,最后比较时间。我不想在我的程序中使用任何代码,例如: p
好吧,这些都是非常简单的方法,而且有几个,所以当它们都是同一件事时,我不想只创建多个问题。 BigO 是我的弱点。我只是想不通他们是如何得出这些答案的。无论如何,您是否可以让我深入了解您对分析其中一些
如何计算此给定代码的 Theta 运行时间: void f(int n) { for (int i=3; i
使用 leiningen 创建 uberjar 并使用 java -jar foo-uberjar.jar 运行该 jar 后程序运行良好,最后一行代码执行得相当快,但程序在关闭前挂了大约一分钟。这是
我是一名优秀的程序员,十分优秀!