- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我只是想做一个简单的 RandomForestRegressor 示例。但是在测试准确性时我得到了这个错误
/Users/noppanit/anaconda/lib/python2.7/site-packages/sklearn/metrics/classification.pyc
in accuracy_score(y_true, y_pred, normalize, sample_weight) 177 178 # Compute accuracy for each possible representation --> 179 y_type, y_true, y_pred = _check_targets(y_true, y_pred) 180 if y_type.startswith('multilabel'): 181 differing_labels = count_nonzero(y_true - y_pred, axis=1)
/Users/noppanit/anaconda/lib/python2.7/site-packages/sklearn/metrics/classification.pyc
in _check_targets(y_true, y_pred) 90 if (y_type not in ["binary", "multiclass", "multilabel-indicator", 91 "multilabel-sequences"]): ---> 92 raise ValueError("{0} is not supported".format(y_type)) 93 94 if y_type in ["binary", "multiclass"]:
ValueError: continuous is not supported
这是数据样本。我无法显示真实数据。
target, func_1, func_2, func_2, ... func_200
float, float, float, float, ... float
这是我的代码。
import pandas as pd
import numpy as np
from sklearn.preprocessing import Imputer
from sklearn.ensemble import RandomForestClassifier, RandomForestRegressor, ExtraTreesRegressor, GradientBoostingRegressor
from sklearn.cross_validation import train_test_split
from sklearn.metrics import accuracy_score
from sklearn import tree
train = pd.read_csv('data.txt', sep='\t')
labels = train.target
train.drop('target', axis=1, inplace=True)
cat = ['cat']
train_cat = pd.get_dummies(train[cat])
train.drop(train[cat], axis=1, inplace=True)
train = np.hstack((train, train_cat))
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
imp.fit(train)
train = imp.transform(train)
x_train, x_test, y_train, y_test = train_test_split(train, labels.values, test_size = 0.2)
clf = RandomForestRegressor(n_estimators=10)
clf.fit(x_train, y_train)
y_pred = clf.predict(x_test)
accuracy_score(y_test, y_pred) # This is where I get the error.
最佳答案
是因为accuracy_score仅用于分类任务。对于回归,你应该使用不同的东西,例如:
clf.score(X_test, y_test)
其中X_test是样本,y_test是相应的ground truth值。它将在内部计算预测。
关于python - 在 RandomForestRegressor 中得到连续不支持的错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32664717/
我正在为我的项目使用RandomForestRegressor(来自Python中出色的Scikt-Learn库),它给了我很好的结果,但我认为我可以做得更好。当我为“fit(..)”函数提供功能时,
sklearn 随机森林的文档页面说 The only supported criterion is “mse” for the mean squared error. 我的数据很乱并且有异常值,我觉
在使用 RandomForestRegressor 时,我注意到一些奇怪的事情。为了说明问题,这里有一个小例子。我在测试数据集上应用了 RandomForestRegressor 并绘制了森林中第一棵
我使用这段代码希望实现确定性: from sklearn.ensemble import RandomForestRegressor np.random.seed(0) import random r
我每秒只能用这个超慢的模型做出 2-3 次预测。使用 LinearRegression 模型时,我可以轻松实现 40 倍的加速。 我正在使用 scikit-learn python 包和一个非常简单的
我只是想做一个简单的 RandomForestRegressor 示例。但是在测试准确性时我得到了这个错误 /Users/noppanit/anaconda/lib/python2.7/site-pa
我正在学习机器学习,我想使用 scikit-learn 的 RandomForestRegressor() 在相当复杂的数据集上。不过,为了首先掌握它的窍门,我正在尝试完成一个基本示例,如下所示: i
我是数据科学领域的新手。我正在尝试找出我的数据集的特征重要性排名。我已经应用了随机森林并得到了输出。 这是我的代码: # importing libraries import pandas as pd
有谁知道在 sklearn 中绘制随机森林回归器的树的 MSE 的方法吗? 在 R 中这非常简单: > fit = randomForest(y ~ X) > plot(fit) 但我还没有找到在 p
我有一个包含我的标签的 pandas 系列 s 和一个包含我的数据的 pandas DataFrame df 。我想使用 sklearn RandomForestRegressor 生成标签的预测。
我尝试将 GridSearchCV 用于 RandomForestRegressor,但总是得到 ValueError: Found array with dim 100. Expected 500。
我正在努力从我的 RandomForestRegressor 中提取特征重要性,我得到: AttributeError: 'GridSearchCV' object has no attribute
我在使用随机森林对分类进行网格搜索时遇到此错误。 from sklearn.ensemble import RandomForestRegressor rf2 = RandomForestRegres
有什么方法可以利用应用于RandomForestRegressor的partial_fit()方法。目的是通过新的增量方式重用经过训练的模型。我不想使用常规 SGD.A示例代码会有很大帮助。 最佳答案
我正在尝试将 RandomForestRegressor 拟合到我的训练集中, rfr.fit(train_X , train_y) 但不断收到以下警告: /usr/local/lib/python2
可能是一个非常愚蠢的问题,所以请对我宽容一点,但我开始了。 这就是我的数据的样子... date,locale,category,site,alexa_rank,sessions,user_login
我正在尝试拟合随机森林回归,我想通过查看集合中每个回归树的输出(以某种列表形式返回给我)来获得估计的分布。在R中,在randomForest预测方法中提供predict.all选项可以为我做到这一点,
我正在开发 C# 应用程序,我需要使用机器学习算法(随机森林)。 C# 不太适合数据分析,因此我将数据保存到 .csv 文件,然后使用出色的 scikit-learn 库在 Python 中进行分析。
我有一个数据集,其中包含一个特征向量和一个目标 - 1.0 或 0.0(代表两个类)。如果我拟合一个 RandomForestRegressor 并调用它的 predict 函数,它是否等同于使用 R
我正在阅读有关使用 GridSearchCV 微调模型的文章,我遇到了如下所示的参数网格: param_grid = [ {'n_estimators': [3, 10, 30], 'max_feat
我是一名优秀的程序员,十分优秀!