python - RFECV 机器学习特征选择花费的 Python 时间太长-6ren

python - RFECV 机器学习特征选择花费的 Python 时间太长

转载作者：行者123 更新时间：2023-12-02 03:06:49

24

4

我是 SKLearn 的新手，对特征选择有疑问。

我正在尝试构建一个 SVM 模型，我的数据具有大约 30 个特征，所有这些特征都大约 10k 个数据点，我目前正在尝试尽可能多地消除无用的特征。我先舍弃了与其他特征高度相关的特征，现在想使用 RFECV 优化剩余的特征。

首先，我在 sklearn 网站上找到了这段代码，我遇到了一些问题，想知道是否有人可以提供帮助。

X = df.drop(['label'], axis=1)
y = df['label']

rfe = RFECV(SVR(kernel='linear'), step=1, scoring='accuracy')
rfe.fit(X, y)
print(rfe.ranking_)

首先，如果我按原样运行它，它需要永远运行，我已经离开它很长时间了，但实际上我还没有设法让它完成。但是，如果我删除 kernel='linear'，它运行得相当快，但随后会产生一条错误消息，该消息似乎来自 rfe.fit(X, y):

RuntimeError:分类器未公开“coef_”或“feature_importances_”属性

我已经将我的功能减少到大约 10 个，只是为了看看我是否可以加快速度作为测试，并且还尝试使用 step 变量，但是使用 kernel='linear' 变量似乎没有任何帮助加速它，它只是运行了几个小时而没有做任何事情。我想要的只是使用 RFECV 方法使用的功能列表。有人对我做错了什么或我可以做些什么来加快速度有什么建议吗？

非常感谢

最佳答案

当您删除“kernel='linear'”时它运行得很快的原因是它很快就会失败。
只有 SVR(kernel='linear') 返回可由 RFECV 使用的 coef_。如果您使用任何其他内核，则不会返回 coef_，因此 RFECV 无法使用它。
通过设置“step=1”，您强制 RFECV(SVR(kernel='linear'), step=1, scoring='accuracy') 适应所有 n 个特征，排除系数最低的特征，再次拟合 n-1 个特征，再次排除系数最低的特征，等等。这很耗时。

试试这个来加快这个过程:

RFECV(SVR(kernel='linear'), step=5, scoring='accuracy', min_features_to_select = 10)

这应该明显更快。根据您的特定需求调整“step”和“min_features_to_select”。

关于python - RFECV 机器学习特征选择花费的 Python 时间太长，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58797050/

24

4

0

文章推荐： php - 使用Gmail SMTP发送邮件php不要到达

sql - MySQL更新花费(太)长的时间
在我们的服务出现一些预期的增长之后，突然间一些更新花费了非常长的时间，这些过去非常快，直到表达到大约 2MM 记录，现在它们每个需要大约 40-60 秒。 update table1 set fiel
java - 如果传感器更新(太)慢，服务就会被终止
我在服务中实现了一个传感器事件监听器，只要采样周期和最大报告延迟低于 1 秒，该监听器就可以正常工作，但一旦我将采样周期增加到超过 1 秒，传感器就根本不会更新。我希望采样周期为 10 秒(可能是
python - 我的 Tkinter GUI 太...静态？
我使用 Tkinter GUI 来启动测量和分析过程，基本上只需单击一个按钮即可开始。由于这些测量可能需要一段时间，我尝试添加一个进度条，即这个: http://tkinter.unpythonic.
c++ - 无法转换 Omnet++::Packet 太 Inet::Packet
我正在尝试使用套接字发送数据包，但出现错误。 invalid conversion from ‘omnetpp::cPacket*’ to ‘inet::Packet*’ [-fpermissive]
ruby - 为什么 split (' ' ) 试图变得(太)聪明？
我刚刚发现 String#split 有以下奇怪的行为: "a\tb c\nd".split => ["a", "b", "c", "d"] "a\tb c\nd".split(' ') => ["a
clojurescript - 使用 Klipse 和 Reagent 的 clojurescript 中的时间间隔非常(太)快
您好，我正在尝试 ClojureScript，我正在使用 Klipse作为我的 REPL 差不多。这可能不是它的预期用途，但因为我没有做任何太复杂的事情，所以现在没问题。我遇到的一个问题是尝试设置计
watchkit - 对于 Watch Complication 和 Time Travel，getTimelineEntriesForComplication 被(太)经常调用
根据下面的数据，ClockKit 会生成一次 future 的 CLKComplicationTimelineEntry 项，但对于过去的时间点，会进行 24 次调用!这是为什么？更多详情: 我注意
javascript - Bookshelf.js/Knex.js 太 "helpful"与 UTC DATETIME 列
我有一个 MySQL 表，这个表有一个名为 datetime_utc 的 DATETIME 列。如您所料，它是 UTC 日期和时间。在我的 Bookshelf 模型中，我定义了一个虚拟 getter，
别再用 System.currentTimeMillis 统计耗时了，太 Low，试试 Spring Boot 源码在用的 StopWatch吧，够优雅
大家好，我是二哥呀！昨天，一位球友问我能不能给他解释一下 @SpringBootApplication 注解是什么意思，还有 Spring Boot 的运行原理，于是我就带着他扒拉了一下这个注解的源

首页

博学

6Ren·AI

商城

python - RFECV 机器学习特征选择花费的 Python 时间太长