python - 如何将多个分布列表传递给 sklearn randomizedSearchCV-6ren

python - 如何将多个分布列表传递给 sklearn randomizedSearchCV

转载作者：太空宇宙更新时间：2023-11-04 03:08:59

26

4

我有一个自定义的 Python 估算器对象 (mkl_regressor)。此类对象的学习参数之一是 float 的 numpy.array。通常 sklearn 估计器对象由单个参数调整，例如 SVM 的 C。因此，randomizedSearchCV 搜索对象采用分布或值列表来从给定分布(在我的示例中是 scipy.stats.expon)中获取所需的值范围。我试图传递分布列表，但没有成功，因为 randomizedSearchCV 不执行分布数组中的元素。这是我尝试过的:

from modshogun import *
import Gnuplot, Gnuplot.funcutils
from numpy import *
from sklearn.metrics import r2_score

class mkl_regressor():

    def __init__(self, widths = [0.01, 0.1, 1.0, 10.0, 50.0, 100.0], kernel_weights = [0.01, 0.1, 1.0,], svm_c = 0.01, mkl_c = 1.0, svm_norm = 1, mkl_norm = 1, degree = 2):
        self.svm_c = svm_c
        self.mkl_c = mkl_c
        self.svm_norm = svm_norm
        self.mkl_norm = mkl_norm
        self.degree = degree
        self.widths = widths
        self.kernel_weights = kernel_weights


    def fit(self, X, y, **params):
        for parameter, value in params.items():
            setattr(self, parameter, value)        

        self.feats_train = RealFeatures(X.T)
        labels_train = RegressionLabels(y.reshape((len(y), )))
        self._kernels_  = CombinedKernel()
        for width in self.widths:
            kernel = GaussianKernel()
            kernel.set_width(width)
            kernel.init(self.feats_train,self.feats_train)
            self._kernels_.append_kernel(kernel)
            del kernel

        kernel = PolyKernel(10, self.degree)            
        self._kernels_.append_kernel(kernel)
        del kernel

        self._kernels_.init(self.feats_train, self.feats_train)

        binary_svm_solver = SVRLight()
        self.mkl = MKLRegression(binary_svm_solver)

        self.mkl.set_C(self.svm_c, self.svm_c)
        self.mkl.set_C_mkl(self.mkl_c)
        self.mkl.set_mkl_norm(self.mkl_norm)
        self.mkl.set_mkl_block_norm(self.svm_norm)

        self.mkl.set_kernel(self._kernels_)
        self.mkl.set_labels(labels_train)
        self.mkl.train()
        self.kernel_weights = self._kernels_.get_subkernel_weights()

    def predict(self, X):
        self.feats_test = RealFeatures(X.T)
        self._kernels_.init(self.feats_train, self.feats_test) 
        self.mkl.set_kernel(self._kernels_)
        return self.mkl.apply_regression().get_labels()

    def set_params(self, **params):
        for parameter, value in params.items():
            setattr(self, parameter, value)

        return self

    def get_params(self, deep=False):

        return {param: getattr(self, param) for param in dir(self) if not param.startswith('__') and not callable(getattr(self,param))}    

    def score(self,  X_t, y_t):

        predicted = self.predict(X_t)
        return r2_score(predicted, y_t)    

if __name__ == "__main__":

    from sklearn.grid_search import RandomizedSearchCV as RS
    from scipy.stats import randint as sp_randint
    from scipy.stats import expon

    labels = array([2.0,0.0,2.0,1.0,3.0,2.0])
    labels = labels.reshape((len(labels), 1))
    data = array([[1.0,2.0,3.0],[1.0,2.0,9.0],[1.0,2.0,3.0],[1.0,2.0,0.0],[0.0,2.0,3.0],[1.0,2.0,3.0]])
    labels_t = array([1.,3.,4])
    labels_t = labels_t.reshape((len(labels_t), 1))
    data_t = array([[20.0,30.0,40.0],[10.0,20.0,30.0],[10.0,20.0,40.0]])
    k = 3

    param_grid = [ {'svm_c': expon(scale=100, loc=5),
                'mkl_c': expon(scale=100, loc=5),
                'degree': sp_randint(0, 32),
                #'widths': [array([4.0,6.0,8.9,3.0]), array([4.0,6.0,8.9,3.0,2.0, 3.0, 4.0]), array( [100.0, 200.0, 300.0, 400.0]) 
                'widths': [[expon, expon]] 
              }]

    mkl = mkl_regressor()
    rs = RS(mkl, param_distributions = param_grid[0], n_iter = 10, n_jobs = 24, cv = k)#, scoring="r2", verbose=True)
    rs.fit(data, labels)
    preds = rs.predict(data_t)

    print "R^2: ", rs.score(data_t, labels_t)
    print "Parameters: ", rs.best_params_

通过将 numpy 数组作为参数字典的列表 'widths' 的元素传递，上述代码运行良好。但是，当我尝试传递分布列表时，randomizedSearchCV 对象没有按预期响应:

/home/ignacio/distributionalSemanticStabilityThesis/mkl_test.py in fit(self=<__main__.mkl_regressor instance>, X=array([[ 1.,  2.,  3.],
       [ 1.,  2.,  0.],
       [ 0.,  2.,  3.],
       [ 1.,  2.,  3.]]), y=array([[ 2.],
       [ 1.],
       [ 3.],
       [ 2.]]), **params={})
     24         self.feats_train = RealFeatures(X.T)
     25         labels_train = RegressionLabels(y.reshape((len(y), )))
     26         self._kernels_  = CombinedKernel()
     27         for width in self.widths:
     28             kernel = GaussianKernel()
---> 29             kernel.set_width(width)
        kernel.set_width = <built-in method set_width of GaussianKernel object>
        width = <scipy.stats._continuous_distns.expon_gen object>
     30             kernel.init(self.feats_train,self.feats_train)
     31             self._kernels_.append_kernel(kernel)
     32             del kernel
     33 

TypeError: in method 'GaussianKernel_set_width', argument 2 of type 'float64_t'

我不想强制估算器执行每个分布生成器，因为在这种情况下，randomizedSearchCV 无法控制使用的值。

一些建议？谢谢。

最佳答案

RandomizedSearchCV 可以采用要尝试的参数值列表 或具有 rvs 采样方法的分布对象。如果您向它传递一个列表，它会假定您传递了一组离散的参数值以从中进行采样。它不支持单个参数的分布列表。如果现有的发行版不适合您的需要，请定制一个。

如果您需要返回数组的分布，只需创建一个具有 rvs() 方法的类即可返回随机样本并传递该实例的实例，而不是单变量分布列表。

关于python - 如何将多个分布列表传递给 sklearn randomizedSearchCV，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38667784/

26

4

0

文章推荐： Python tkinter 密码强度检查器 gui

文章推荐： javascript - 将二进制字符串写入图像文件

文章推荐：一定数量的数据后 Python 子进程失败

java - 使用 Parcelable 传递 Arraylist，传递 null
Github:https://github.com/jjvang/PassIntentDemo 我一直在关注有关按 Intent 传递对象的教程:https://www.javacodegeeks.c
c# - 试图让我的文本字段在按下按钮时作为 FormCollection 传递，但 FormCollection 以 null 传递
我有一个 View ，其中包含自动生成的 text 类型的 input 框。当我单击“通过电子邮件发送结果”按钮时，代码会将您带到 CalculatedResults Controller 中的 Em
docker - 传递--env变量现在可以与ENTRYPOINT一起使用
我有一个基本的docker镜像，我将以此为基础构建自己的镜像。我没有基础镜像的Dockerfile。基本上，基本镜像使用两个--env arg，一个接受其许可证，一个选择在容器中激活哪个框架。我可以
f# - 传递 ** 作为参数
假设我想计算 2^n 的总和，n 范围从 0 到 100。我可以编写以下内容: seq { 0 .. 100 } |> Seq.sumBy ((**) 2I) 但是，这与 (*) 或其他运算符/函数不
php 传递 URL
我有这个网址: http://www.example.com/get_url.php?ID=100&Link=http://www.test.com/page.php?l=1&m=7 当我打印 $_G
javascript - 传递 createObjectURL
我想将 window.URL.createObjectURL(file) 创建的地址传递给 dancer.js 但我得到 GET blob:http%3A//localhost/b847c5cd-aa
C++ 传递 typedef
我想知道如何将 typedef 传递给函数。例如: typedef int box[3][3]; box empty, *board[3][3]; 我如何将 board 传递给函数？我
ios - 传递 NSManagedObject
我正在将一些代码从我的 Controller 移动到核心数据应用程序中的模型。我编写了一个方法，该方法为我定期发出的特定获取请求返回 NSManagedObjectID。 + (NSManagedO
javascript - 将类型化数组作为 any[] 传递？
为什么我不能将类型化数组传递到采用 any[] 的函数/构造函数中？ typedArray = new MyType[ ... ]; items = new ko.observableArray(ty
javascript - 传递 "this"作为参数
我是一名新的 Web 开发人员，正在学习 html5 和 javascript。我有一个带有“选项卡”的网页，可以使网页的某些部分消失并重新出现。链接如下: HOME 和 JavaScript 函
c# - 将代码作为参数C#传递
我试图将对函数的引用作为参数传递很难解释我会写一些伪代码示例 (calling function) function(hello()); function(pass) { if this =
c# - 传递 DataTypeEnum
我在尝试调用我正在创建的 C# 项目中的函数时遇到以下错误: System.Runtime.InteropServices.COMException: Operation is not allowed
linux - 传递\*作为参数的参数
使用 ksh。尝试重用当前脚本而不修改它，基本上可以归结为如下内容: `expr 5 $1 $2` 如何将乘法命令 (*) 作为参数 $1 传递？我首先尝试使用“*”，甚至是\*，但没有用。我尝试
Java - 传递 "this"时在对象属性中获取空值
我一直在研究“Play for Java”这本书，这本书非常棒。我对 Java 还是很陌生，但我一直在关注这些示例，我有点卡在第 3 章上了。可以在此处找到代码:Play for Java on Gi
javascript - js中的函数按值或引用复制/传递
我知道 Javascript 中的对象是通过引用复制/传递的。但是函数呢？当我跳到一些令人困惑的地方时，我正在尝试这段代码。这是代码片段: x = function() { console.log(
python - 传递 !, !=, ~, <, > 作为参数
我希望能够像这样传递参数: fn(a>=b) or fn(a!=b) 我在 DjangoORM 和 SQLAlchemy 中看到了这种行为，但我不知道如何实现它。最佳答案 ORM 使用 specia
javascript - 更新依赖会破坏另一个正在使用它的依赖(传递)
在我的 Angular 项目中，我最近将 rxjs 升级到版本 6。现在，来自 npm 的模块(在 node_modules 文件夹内)由于一些破坏性更改而失败(旧的进口不再有效)。我为我的代码调整了
c - 传递 `*` 时命令行参数编号不正确
这个问题在这里已经有了答案: The issue of * in Command line argument (6 个答案) 关闭 3 年前。我正在编写一个关于反向波兰表示法的 C 程序，它通过命
javascript - 传递 $(this) 作为参数？
$(document).ready(function() { function GetDeals() { alert($(this).attr("id")); } $('.filter
perl中子程序中参数的两种引用(传递)方式介绍
下面是一个例子：复制代码代码如下: use strict; #这里是两个数组 my @i =('1','2','3'); my @j =('a','b','c'); &n

首页

博学

6Ren·AI

商城

python - 如何将多个分布列表传递给 sklearn randomizedSearchCV