python - RandomizedSearchCv 导致属性错误-6ren

python - RandomizedSearchCv 导致属性错误

转载作者：行者123 更新时间：2023-11-30 09:01:06

26

4

在 RandomizedSearchCv 上执行 fit() 后:

        tfidf = TfidfVectorizer(strip_accents=None,lowercase=False,preprocessor=None)
        param_grid = 
            {'vect__ngram_range': [(1,1)],'vect__stop_words': [stop, None],
                       'vect__tokenizer': [tokenizer, tokenizer_porter],
                       'clf__penalty': ['l1', 'l2'],
            'clf__C': [1.0, 10.0, 100.0]},
lr_tfidf = Pipeline([('vect', tfidf),('clf',LogisticRegression(random_state=0))])
gs_lr_tfidf = RandomizedSearchCV(lr_tfidf,param_grid,cv=5,n_jobs=1)
gs_lr_tfidf.fit(X_train, y_train)

我收到以下错误:

    Traceback (most recent call last):
  File "G:/pythonprojectraschka/ch08/ch08-2.py", line 95, in <module>
    gs_lr_tfidf.fit(X_train, y_train)
  File "C:\Anaconda3\lib\site-packages\sklearn\grid_search.py", line 996, in fit
    return self._fit(X, y, sampled_params)
  File "C:\Anaconda3\lib\site-packages\sklearn\grid_search.py", line 553, in _fit
    for parameters in parameter_iterable
  File "C:\Anaconda3\lib\site-packages\sklearn\externals\joblib\parallel.py", line 800, in __call__
    while self.dispatch_one_batch(iterator):
  File "C:\Anaconda3\lib\site-packages\sklearn\externals\joblib\parallel.py", line 653, in dispatch_one_batch
    tasks = BatchedCalls(itertools.islice(iterator, batch_size))
  File "C:\Anaconda3\lib\site-packages\sklearn\externals\joblib\parallel.py", line 68, in __init__
    self.items = list(iterator_slice)
  File "C:\Anaconda3\lib\site-packages\sklearn\grid_search.py", line 549, in <genexpr>
    delayed(_fit_and_score)(clone(base_estimator), X, y, self.scorer_,
  File "C:\Anaconda3\lib\site-packages\sklearn\grid_search.py", line 223, in __iter__
    for v in self.param_distributions.values()])
AttributeError: 'list' object has no attribute 'values'

但例如，Pipeline(lr_tfidf) 执行没有任何问题:

lr_tfidf.fit(X_train, y_train)

可能是什么原因？ X_train(text) 和 y_train(binary) 是正确的(我猜)numpy 数组。

带有数据集的完整代码: https://github.com/kuba2111/untitled12

最佳答案

这里您使用的是 RandomizedSearchCV而不是GridSearchCV 。所以看起来它认为其中一个参数是一个分布，并尝试从这个分布中采样。

因此，如果您愿意使用 GridSearchCV 对所有参数进行详尽的搜索，那么您的解决方案就是您的解决方案。

关于python - RandomizedSearchCv 导致属性错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36488564/

26

4

0

文章推荐： java - 带有 TagSoup 和不间断空格值的 Groovy XmlSlurper

文章推荐： php - 自动更新出价 - PHP/Ajax

文章推荐： java - Embedded-Task-Forms 不显示 Camunda 7.2.0-alpha5 中变量的值

python - RandomizedSearchCV 精度分数在随机森林中不匹配
我正在尝试使用RandomizedSearchCV在随机森林上进行一些超参数优化。我将评分方法设置为平均精度。 rand_search.best_score_ 约为 0.38(对于我的数据集来说是一个
python - RandomizedSearchCv 导致属性错误
在 RandomizedSearchCv 上执行 fit() 后: tfidf = TfidfVectorizer(strip_accents=None,lowercase=False
python - 执行 randomizedSearchCV 时通过了多个评估指标
我目前正在玩一个关于 xgboost 中超参数优化的玩具示例。在以下示例中，我将执行以下步骤: 从 sklearn 加载 iris 数据集并将其拆分为训练集和测试集。声明一个我想探索的参数网格。鉴
python - 使用 RandomizedSearchCV 进行随机森林调整
我有一些关于随机森林回归模型中的随机网格搜索的问题。我的参数网格如下所示: random_grid = {'bootstrap': [True, False], 'max
python - GridSearchCV & RandomizedSearchCV - 运行后是否重新拟合模型
我有一些测试和训练数据，测试数据没有任何因变量。我目前正在运行 GridSearchCV 或 RandomizedSearchCV 来查找最佳参数。我应该将所有“测试” X 和 y 值传递到 Gr
python - 获取 RandomizedSearchCV 最佳模型的概率
我使用 RandomizedSearchCV 通过 10 倍交叉验证和 100 次迭代来获得最佳参数。这效果很好。但现在我还想从性能最佳的模型中获取每个预测测试数据点的概率(例如 predict_pr
python - RandomizedSearchCV 的 PermissionError
我正在尝试使用 RandomizedSearchCV 来调整随机森林的超参数，但在运行代码后立即收到 PermissionError 。初始运行没有 PermissionError (但是它确实抛出
python - 如何将多个分布列表传递给 sklearn randomizedSearchCV
我有一个自定义的 Python 估算器对象 (mkl_regressor)。此类对象的学习参数之一是 float 的 numpy.array。通常 sklearn 估计器对象由单个参数调整，例如 SV
python - 如何使用 RandomizedSearchCV 正确实现 StratifiedKFold
我正在尝试使用 stratifiedKFold 和 RandomizedSearchCV 来实现随机森林分类器。问题是我可以看到 RandomizedSearchCV 的“cv”参数用于进行交叉验证。
python - sklearn 使用带有自定义指标的 RandomizedSearchCV 并捕获异常
我在 sklearn 中使用 RandomizedSearchCV 函数和随机森林分类器。为了查看不同的指标，我使用自定义评分 from sklearn.metrics import make_sco
python - RandomizedSearchCV 中 fit_params 的含义
我想使用RandomizedSearchCV来自 scikit-learn。在构造函数中，我可以传递 param_distributions ，即我想要优化的不同参数的分布。但还有 fit_param
python - 无法通过使用相同参数运行单个模型来重现 GridSearchCV/RandomizedSearchCV 的结果
我正在运行 5 倍的 RandomizedSearchCV 以便找到最佳参数。我有一个用于预测的保留集 (X_test)。我的部分代码是: svc= SVC(class_weight=class_we
python - Sklearn MLP 分类器隐藏层优化 (RandomizedSearchCV)
我设置了以下参数: parameter_space = { 'hidden_layer_sizes': [(sp_randint.rvs(100,600,1),sp_randint.rvs(1
python - Sklearn MLP 分类器超参数优化 (RandomizedSearchCV)
我设置了以下参数: parameter_space = { 'hidden_layer_sizes': [(sp_randint(100,600),sp_randint(100,600),),
python - RandomizedSearchCV 和 XGBoost + 提前停止
我尝试使用“AUCPR”作为使用 Sklearn 的 RandomSearchCV 和 Xgboost 提前停止的评估标准，但我无法为提前停止拟合参数指定 maximize=True 。相反，eval
python - RandomizedSearchCV 使用相同的 random_state 给出不同的结果
我正在使用管道通过 RandomizedSearchCV 执行特征选择和超参数优化。以下是代码摘要: from sklearn.cross_validation import train_test_s
python - sklearn : use Pipeline in a RandomizedSearchCV?
我希望能够在 sklearn 的 RandomizedSearchCV 构造中使用管道。但是现在我认为只支持估算器。这是我希望能够执行的操作的示例: import numpy as np from s
python - 如何告诉 RandomizedSearchCV 选择分布或 None 值？
假设我们正在尝试找到 RandomForestClassifier 的最佳 max_depth 参数。我们正在使用 RandomizedSearchCV : from scipy.stats impo
python - 带有 LSTM 的 GridSearchCV/RandomizedSearchCV
我一直在尝试通过 RandomizedSearchCV 调整 LSTM 的超参数。我的代码如下: X_train = X_train.reshape((X_train.shape[0], 1, X_
python - 防止 RandomizedSearchCV 预测 KNN 分类器的所有一类
我正在使用 RandomizedSearchCV 和 KNeighborsClassifier 来尝试预测贷款违约。使用 RandomizedSearchCV 在理论上似乎很棒，但当我对其进行测试时

首页

博学

6Ren·AI

商城

python - RandomizedSearchCv 导致属性错误