- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是 SKLearn 的新手,对特征选择有疑问。
我正在尝试构建一个 SVM 模型,我的数据具有大约 30 个特征,所有这些特征都大约 10k 个数据点,我目前正在尝试尽可能多地消除无用的特征。我先舍弃了与其他特征高度相关的特征,现在想使用 RFECV 优化剩余的特征。
首先,我在 sklearn 网站上找到了这段代码,我遇到了一些问题,想知道是否有人可以提供帮助。
X = df.drop(['label'], axis=1)
y = df['label']
rfe = RFECV(SVR(kernel='linear'), step=1, scoring='accuracy')
rfe.fit(X, y)
print(rfe.ranking_)
首先,如果我按原样运行它,它需要永远运行,我已经离开它很长时间了,但实际上我还没有设法让它完成。但是,如果我删除 kernel='linear'
,它运行得相当快,但随后会产生一条错误消息,该消息似乎来自 rfe.fit(X, y)
:
RuntimeError:分类器未公开“coef_”或“feature_importances_”属性
我已经将我的功能减少到大约 10 个,只是为了看看我是否可以加快速度作为测试,并且还尝试使用 step
变量,但是使用 kernel='linear'
变量似乎没有任何帮助加速它,它只是运行了几个小时而没有做任何事情。我想要的只是使用 RFECV 方法使用的功能列表。有人对我做错了什么或我可以做些什么来加快速度有什么建议吗?
非常感谢
最佳答案
试试这个来加快这个过程:
RFECV(SVR(kernel='linear'), step=5, scoring='accuracy', min_features_to_select = 10)
这应该明显更快。根据您的特定需求调整“step”和“min_features_to_select”。
关于python - RFECV 机器学习特征选择花费的 Python 时间太长,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58797050/
在我们的服务出现一些预期的增长之后,突然间一些更新花费了非常长的时间,这些过去非常快,直到表达到大约 2MM 记录,现在它们每个需要大约 40-60 秒。 update table1 set fiel
我在服务中实现了一个传感器事件监听器,只要采样周期和最大报告延迟低于 1 秒,该监听器就可以正常工作,但一旦我将采样周期增加到超过 1 秒,传感器就根本不会更新。 我希望采样周期为 10 秒(可能是
我使用 Tkinter GUI 来启动测量和分析过程,基本上只需单击一个按钮即可开始。由于这些测量可能需要一段时间,我尝试添加一个进度条,即这个: http://tkinter.unpythonic.
我正在尝试使用套接字发送数据包,但出现错误。 invalid conversion from ‘omnetpp::cPacket*’ to ‘inet::Packet*’ [-fpermissive]
我刚刚发现 String#split 有以下奇怪的行为: "a\tb c\nd".split => ["a", "b", "c", "d"] "a\tb c\nd".split(' ') => ["a
您好,我正在尝试 ClojureScript,我正在使用 Klipse作为我的 REPL 差不多。这可能不是它的预期用途,但因为我没有做任何太复杂的事情,所以现在没问题。 我遇到的一个问题是尝试设置计
根据下面的数据,ClockKit 会生成一次 future 的 CLKComplicationTimelineEntry 项,但对于过去的时间点,会进行 24 次调用!这是为什么? 更多详情: 我注意
我有一个 MySQL 表,这个表有一个名为 datetime_utc 的 DATETIME 列。如您所料,它是 UTC 日期和时间。在我的 Bookshelf 模型中,我定义了一个虚拟 getter,
大家好,我是二哥呀! 昨天,一位球友问我能不能给他解释一下 @SpringBootApplication 注解是什么意思,还有 Spring Boot 的运行原理,于是我就带着他扒拉了一下这个注解的源
我是一名优秀的程序员,十分优秀!