- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在 RandomizedSearchCv 上执行 fit() 后:
tfidf = TfidfVectorizer(strip_accents=None,lowercase=False,preprocessor=None)
param_grid =
{'vect__ngram_range': [(1,1)],'vect__stop_words': [stop, None],
'vect__tokenizer': [tokenizer, tokenizer_porter],
'clf__penalty': ['l1', 'l2'],
'clf__C': [1.0, 10.0, 100.0]},
lr_tfidf = Pipeline([('vect', tfidf),('clf',LogisticRegression(random_state=0))])
gs_lr_tfidf = RandomizedSearchCV(lr_tfidf,param_grid,cv=5,n_jobs=1)
gs_lr_tfidf.fit(X_train, y_train)
我收到以下错误:
Traceback (most recent call last):
File "G:/pythonprojectraschka/ch08/ch08-2.py", line 95, in <module>
gs_lr_tfidf.fit(X_train, y_train)
File "C:\Anaconda3\lib\site-packages\sklearn\grid_search.py", line 996, in fit
return self._fit(X, y, sampled_params)
File "C:\Anaconda3\lib\site-packages\sklearn\grid_search.py", line 553, in _fit
for parameters in parameter_iterable
File "C:\Anaconda3\lib\site-packages\sklearn\externals\joblib\parallel.py", line 800, in __call__
while self.dispatch_one_batch(iterator):
File "C:\Anaconda3\lib\site-packages\sklearn\externals\joblib\parallel.py", line 653, in dispatch_one_batch
tasks = BatchedCalls(itertools.islice(iterator, batch_size))
File "C:\Anaconda3\lib\site-packages\sklearn\externals\joblib\parallel.py", line 68, in __init__
self.items = list(iterator_slice)
File "C:\Anaconda3\lib\site-packages\sklearn\grid_search.py", line 549, in <genexpr>
delayed(_fit_and_score)(clone(base_estimator), X, y, self.scorer_,
File "C:\Anaconda3\lib\site-packages\sklearn\grid_search.py", line 223, in __iter__
for v in self.param_distributions.values()])
AttributeError: 'list' object has no attribute 'values'
但例如,Pipeline(lr_tfidf) 执行没有任何问题:
lr_tfidf.fit(X_train, y_train)
可能是什么原因? X_train(text) 和 y_train(binary) 是正确的(我猜)numpy 数组。
带有数据集的完整代码: https://github.com/kuba2111/untitled12
最佳答案
这里您使用的是 RandomizedSearchCV而不是GridSearchCV 。所以看起来它认为其中一个参数是一个分布,并尝试从这个分布中采样。
因此,如果您愿意使用 GridSearchCV 对所有参数进行详尽的搜索,那么您的解决方案就是您的解决方案。
关于python - RandomizedSearchCv 导致属性错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36488564/
我正在尝试使用RandomizedSearchCV在随机森林上进行一些超参数优化。我将评分方法设置为平均精度。 rand_search.best_score_ 约为 0.38(对于我的数据集来说是一个
在 RandomizedSearchCv 上执行 fit() 后: tfidf = TfidfVectorizer(strip_accents=None,lowercase=False
我目前正在玩一个关于 xgboost 中超参数优化的玩具示例。在以下示例中,我将执行以下步骤: 从 sklearn 加载 iris 数据集并将其拆分为训练集和测试集。 声明一个我想探索的参数网格。 鉴
我有一些关于随机森林回归模型中的随机网格搜索的问题。我的参数网格如下所示: random_grid = {'bootstrap': [True, False], 'max
我有一些测试和训练数据,测试数据没有任何因变量。 我目前正在运行 GridSearchCV 或 RandomizedSearchCV 来查找最佳参数。 我应该将所有“测试” X 和 y 值传递到 Gr
我使用 RandomizedSearchCV 通过 10 倍交叉验证和 100 次迭代来获得最佳参数。这效果很好。但现在我还想从性能最佳的模型中获取每个预测测试数据点的概率(例如 predict_pr
我正在尝试使用 RandomizedSearchCV 来调整随机森林的超参数,但在运行代码后立即收到 PermissionError 。 初始运行没有 PermissionError (但是它确实抛出
我有一个自定义的 Python 估算器对象 (mkl_regressor)。此类对象的学习参数之一是 float 的 numpy.array。通常 sklearn 估计器对象由单个参数调整,例如 SV
我正在尝试使用 stratifiedKFold 和 RandomizedSearchCV 来实现随机森林分类器。问题是我可以看到 RandomizedSearchCV 的“cv”参数用于进行交叉验证。
我在 sklearn 中使用 RandomizedSearchCV 函数和随机森林分类器。为了查看不同的指标,我使用自定义评分 from sklearn.metrics import make_sco
我想使用RandomizedSearchCV来自 scikit-learn。在构造函数中,我可以传递 param_distributions ,即我想要优化的不同参数的分布。但还有 fit_param
我正在运行 5 倍的 RandomizedSearchCV 以便找到最佳参数。我有一个用于预测的保留集 (X_test)。我的部分代码是: svc= SVC(class_weight=class_we
我设置了以下参数: parameter_space = { 'hidden_layer_sizes': [(sp_randint.rvs(100,600,1),sp_randint.rvs(1
我设置了以下参数: parameter_space = { 'hidden_layer_sizes': [(sp_randint(100,600),sp_randint(100,600),),
我尝试使用“AUCPR”作为使用 Sklearn 的 RandomSearchCV 和 Xgboost 提前停止的评估标准,但我无法为提前停止拟合参数指定 maximize=True 。相反,eval
我正在使用管道通过 RandomizedSearchCV 执行特征选择和超参数优化。以下是代码摘要: from sklearn.cross_validation import train_test_s
我希望能够在 sklearn 的 RandomizedSearchCV 构造中使用管道。但是现在我认为只支持估算器。这是我希望能够执行的操作的示例: import numpy as np from s
假设我们正在尝试找到 RandomForestClassifier 的最佳 max_depth 参数。我们正在使用 RandomizedSearchCV : from scipy.stats impo
我一直在尝试通过 RandomizedSearchCV 调整 LSTM 的超参数。 我的代码如下: X_train = X_train.reshape((X_train.shape[0], 1, X_
我正在使用 RandomizedSearchCV 和 KNeighborsClassifier 来尝试预测贷款违约。 使用 RandomizedSearchCV 在理论上似乎很棒,但当我对其进行测试时
我是一名优秀的程序员,十分优秀!