- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我想使用 scikit-learn 管道的第一步生成玩具数据集,以评估我的分析性能。我提出的一个尽可能简单的示例解决方案如下所示:
import numpy as np
from sklearn.pipeline import Pipeline
from sklearn.grid_search import GridSearchCV
from sklearn.base import TransformerMixin
from sklearn import cluster
class FeatureGenerator(TransformerMixin):
def __init__(self, num_features=None):
self.num_features = num_features
def fit(self, X, y=None, **fit_params):
return self
def transform(self, X, **transform_params):
return np.array(
range(self.num_features*self.num_features)
).reshape(self.num_features,
self.num_features)
def get_params(self, deep=True):
return {"num_features": self.num_features}
def set_params(self, **parameters):
self.num_features = parameters["num_features"]
return self
这个变压器在行动中将 e。 G。像这样调用:
pipeline = Pipeline([
('pick_features', FeatureGenerator(100)),
('kmeans', cluster.KMeans())
])
pipeline = pipeline.fit(None)
classes = pipeline.predict(None)
print classes
一旦我尝试通过此管道进行网格搜索,它就变得棘手了:
parameter_sets = {
'pick_features__num_features' : [10,20,30],
'kmeans__n_clusters' : [2,3,4]
}
pipeline = Pipeline([
('pick_features', FeatureGenerator()),
('kmeans', cluster.KMeans())
])
g_search_estimator = GridSearchCV(pipeline, parameter_sets)
g_search_estimator.fit(None,None)
网格搜索需要样本和标签作为输入,并且不如管道那么健壮,它不会提示 None
作为输入参数:
TypeError: Expected sequence or array-like, got <type 'NoneType'>
这是有道理的,因为网格搜索需要将数据集划分到不同的 cv 分区中。
除了上面的例子,我还有很多参数,可以在数据集生成步骤中进行调整。因此,我需要一个解决方案来将此步骤包含在我的参数选择交叉验证中。
问题有没有办法从第一个转换器内部设置 GridSearch 的 X
和 y
?或者一个解决方案看起来如何,它调用具有多个不同数据集(最好是并行的)的 GridSearch?或者有没有人尝试过自定义 GridSearchCV
或者可以指出一些关于此的阅读 Material ?
最佳答案
您的代码非常干净,因此很高兴为您提供这个快速而肮脏的解决方案:
g_search_estimator.fit([1., 1., 1.],[1., 0., 0.])
g_search_estimator.best_params_
输出:
[tons of int64 to float64 conversion warnings]
{'kmeans__n_clusters': 4, 'pick_features__num_features': 10}
请注意,您需要 3 个样本,因为您正在进行(默认)3 折交叉验证。
你得到的错误是由于 GridSearchCV
对象执行的检查而发生的,所以它发生在你的转换器有机会做任何事情之前。所以我会对你的第一个问题说“不”:
Is there a way to set the Xs and ys of the GridSearch from inside the first transformer?
编辑:
我意识到这是不必要的混淆,以下三行是等效的:g_search_estimator.fit([1., 1., 1.], [1., 0., 0.])g_search_estimator.fit([1., 1., 1.], 无)g_search_estimator.fit([1., 1., 1.])
抱歉匆忙地在其中乱扔了随机的 y
。
关于网格搜索如何计算不同网格点分数的一些解释:当您将 scoring=None
传递给 GridSearchCV
构造函数时(这是默认值,所以这就是你在这里),它向估计器询问得分函数。如果有这样的功能,则用于评分。对于 KMeans
,默认得分函数基本上与聚类中心的距离总和相反。
这是一个无监督指标,因此此处不需要 y
。
总结起来,您将始终能够:
set the Xs of the GridSearch from inside the first transformer
只要将输入的X
“转换”成完全不相关的东西,就不会有人提示了。不过,您确实需要一些输入random_X
。
现在,如果您想使用受监督的指标(我对您的问题有这种感觉),您还需要指定 y
。
一个简单的场景是你有一个固定的 y
向量,你想用它尝试几个 X
。然后你可以这样做:
g_search_estimator.fit(random_X, y, scoring=my_scoring_function)
它应该运行良好。如果您想搜索 y
的不同值,可能会有点棘手。
关于python - scikit-学习管道 : grid search over parameters of transformer to generate data,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31655950/
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题? 更新问题,以便 editing this post 可以用事实和引用来回答它. 关闭 4 年前。 Improve
在 Vim 中,我可以:set wrapscan,这样当我进行增量搜索时,无论第一个匹配项位于光标上方还是下方,光标都会跳转到第一个匹配项。 在 Emacs 中,如果我通过 C-s 开始搜索,如果第一
Elasticsearch 中的页面排名是如何工作的。一旦我们创建了一个索引,就会有一个底层智能层创建一个元数据存储库并提供结果以根据相关性进行查询。我已经创建了几个索引,我想知道在提供查询后结果是如
我们在单个节点上使用 Elasticsearch 对数据进行了索引。我们在后台运行了一个线程,用于使用最近的更改更新索引。 现在我们使用 Elasticsearch API 来运行搜索查询。 {
这突然停止工作,正在工作,但现在却没有: 如果我使用Twitter UI并转到: https://twitter.com/#!/search/%22social%20snap%22%20OR%20%
我在基类中声明了某些字段,并且我想仅为某些子类(实体)注册这些字段。 因此,我不想通过 @Field 注释基类中的这些字段,尽管只需以编程方式注册某些实体就足够了。 但是在基本实体中声明的字段未注册/
我的全文搜索索引有问题。我有一个字符字段大小为 30 的表。我在这个字段上创建了一个全文搜索索引,以便在这个不区分大小写的字段上进行快速搜索操作。现在,当我执行以下查询时:SELECT fieldna
我对SandCaSTLe的输出感到非常满意,但我也想在HTML输出中包含一些搜索功能,这可能吗? 最佳答案 SandCaSTLe帮助文件生成器的网站输出包含 index.aspx 和 index.ht
有没有人遇到过Apache Lucene的功能?我听说它甚至可以与Google Search Appliance(GSA)相提并论。我正在寻找两者之间的明确比较,如果可能的话? 在线上进行的比较非常模
在构建应用程序时,“查找”与“搜索”之间有什么有意义的区别吗?您是否将它们视为同义词? 我在询问应用程序UI和API设计的标签方面。 最佳答案 查找是搜索的完成。 如果您可能无法成功找到某些东西,则将
我想编写一个移动应用程序,它可以拍照并在谷歌图像中搜索类似的图片,然后显示结果。 但是,使用谷歌图像搜索我只能搜索文本字符串,而使用搜索 API 似乎无法搜索相似图片;此功能似乎只能通过网络界面使用。
当我从 Many2one 列表框中选择一个项目时,我想要进行高级搜索。例如,此功能是针对“res.groups”对象实现的。我在/addons 中找不到此功能。 更准确地说,我定义了我的对象 clas
我正在使用 Amazon CloudSearch 存储大量地点。每个地方在一周中的每一天都有开放时间和关闭时间。 我需要按当前时间检索地点。您如何建议对索引进行建模?我想通过创建 7 个文本索引来解决
我见过一些网站,当您执行搜索时会列出相关搜索,即它们会建议您可能感兴趣的其他搜索查询。 我想知道在中型网站中对此进行建模的最佳方法(没有足够的流量来依赖访问者统计数据来推断关系)。我最初的想法是存储每
如何从 Sitecore Lucene 搜索中获取格式化的 url?我创建了一个自定义索引,并在根目录下将其更新为/sitecore/content/websitename/home。 检索到搜索结果
我一直在努力寻找这个并且无法找到我想要的东西。 在我的状态行上,我想要计算当前文件中出现的匹配数。下面的 vim 命令返回我想要的。我需要返回的号码显示在我的状态行中。 :%s/^I^I//n vim
我们有自己的服务器与应用程序一起工作。我们开始使用不同的提供商进行托管,现在我们遇到了上述错误。 关于 同 页面,这有效: 但是这个不 我们无法弄清楚为什么会这样。您
题目地址:https://leetcode.com/problems/search-in-a-binary-search-tree/description/ 题目描述 Given the root
我正在使用很棒的插件 Leaflet.Control.Search为了在我的 map 上搜索标记(来自 geoJson 标记组)——效果很好。 我现在只有一个简单的问题:如何打开搜索结果标记的弹出窗口
我开发了一个允许创建新记录的扩展。 在列表模块中,在记录列表下,有搜索表单。 例如,它适用于 fe 用户,但不适用于我的自定义记录。 是否必须在我的 tca 中添加任何特殊配置才能使此表单与我的自定义
我是一名优秀的程序员,十分优秀!