python - 来自 statsmodels 的自定义估算器 WLS 的 sklearn check

python - 来自 statsmodels 的自定义估算器 WLS 的 sklearn check_estimator 错误

转载作者：行者123 更新时间：2023-12-04 15:16:55

25

4

我创建了 sklearn 自定义估计器(statsmodels.regression.linear_model.WLS with Lasso)以使用交叉验证。 check_estimator() 报告错误，但我没有任何错误，而且它似乎可以运行。

class SMWrapper(BaseEstimator, RegressorMixin):
    def __init__(self, alpha=0, lasso=True):
        self.alpha = alpha
        self.lasso = lasso
    def fit(self, X, y):
        # unpack weight from X
        self.model_ = WLS(y, X[:,:-1], weights=X[:,-1])
        if self.lasso:
            L1_wt = 1
        else:
            L1_wt = 0
        self.results_ = self.model_.fit_regularized(alpha=self.alpha, L1_wt=L1_wt, method='sqrt_lasso')
        return self
    def predict(self, X):
        return self.results_.predict(X[:,:-1])

    # yy shape is (nb_obs), xx shape is (nb_xvar, nb_obs), weight shape is (nb_obs)
    # pack weight as one more xvar, so that train/validation split will be done properly on weight.
    lenx = len(xx)
    xxx = np.full((yy.shape[0], lenx+1), 0.0)
    for i in range(lenx):
        xxx[:,i] = xx[i]
    xxx[:,lenx] = weight
    lassoReg = SMWrapper(lasso=lasso)
    param_grid = {'alpha': alpha}
    grid_search = GridSearchCV(lassoReg, param_grid, cv=10, scoring='neg_mean_squared_error',return_train_score=True)
    grid_search.fit(xxx, yy)

我愿意:

from sklearn.utils.estimator_checks import check_estimator
check_estimator(SMWrapper())

它给出了错误:

---------------------------------------------------------------------------
NotImplementedError                       Traceback (most recent call last)
<ipython-input-518-6da3cc5b584c> in <module>()
----> 1 check_estimator(SMWrapper())

/nfs/geardata/anaconda2/lib/python2.7/site-packages/sklearn/utils/estimator_checks.pyc in check_estimator(Estimator)
    302     for check in _yield_all_checks(name, estimator):
    303         try:
--> 304             check(name, estimator)
    305         except SkipTest as exception:
    306             # the only SkipTest thrown currently results from not

/nfs/geardata/anaconda2/lib/python2.7/site-packages/sklearn/utils/testing.pyc in wrapper(*args, **kwargs)
    346             with warnings.catch_warnings():
    347                 warnings.simplefilter("ignore", self.category)
--> 348                 return fn(*args, **kwargs)
    349 
    350         return wrapper

/nfs/geardata/anaconda2/lib/python2.7/site-packages/sklearn/utils/estimator_checks.pyc in check_estimators_dtypes(name, estimator_orig)
   1100         estimator = clone(estimator_orig)
   1101         set_random_state(estimator, 1)
-> 1102         estimator.fit(X_train, y)
   1103 
   1104         for method in methods:

<ipython-input-516-613d1ce7615e> in fit(self, X, y)
     10         else:
     11             L1_wt = 0
---> 12         self.results_ = self.model_.fit_regularized(alpha=self.alpha, L1_wt=L1_wt, method='sqrt_lasso')
     13         return self
     14     def predict(self, X):

/nfs/geardata/anaconda2/lib/python2.7/site-packages/statsmodels/regression/linear_model.pyc in fit_regularized(self, method, alpha, L1_wt, start_params, profile_scale, refit, **kwargs)
    779             start_params=start_params,
    780             profile_scale=profile_scale,
--> 781             refit=refit, **kwargs)
    782 
    783         from statsmodels.base.elastic_net import (

/nfs/geardata/anaconda2/lib/python2.7/site-packages/statsmodels/regression/linear_model.pyc in fit_regularized(self, method, alpha, L1_wt, start_params, profile_scale, refit, **kwargs)
    998                 RegularizedResults, RegularizedResultsWrapper
    999             )
-> 1000             params = self._sqrt_lasso(alpha, refit, defaults["zero_tol"])
   1001             results = RegularizedResults(self, params)
   1002             return RegularizedResultsWrapper(results)

/nfs/geardata/anaconda2/lib/python2.7/site-packages/statsmodels/regression/linear_model.pyc in _sqrt_lasso(self, alpha, refit, zero_tol)
   1052         G1 = cvxopt.matrix(0., (n+1, 2*p+1))
   1053         G1[0, 0] = -1
-> 1054         G1[1:, 1:p+1] = self.exog
   1055         G1[1:, p+1:] = -self.exog
   1056 

NotImplementedError: invalid type in assignment

调试说 G1 和 self.exog 的形状相同(self.exog 是 float 的，G1 看起来也是 float 的):

ipdb> self.exog.shape
(20, 4)
ipdb> G1[1:, 1:p+1]
<20x4 matrix, tc='d'>

我的代码可能有什么问题？我正在检查结果是否正确，这可能需要一些时间。

谢谢。

最佳答案

我相信您收到此错误消息是由于 WLS 中的错误(类型不匹配)。比较:

import cvxopt
n =10
p = 5
G1 = cvxopt.matrix(0., (n+1, 2*p+1))

G1[0, 0] = -1
x = np.zeros((10,5))
G1[1:, 1:p+1] = x.astype("float64")

对比:

G1[1:, 1:p+1] = x.astype("float32")
NotImplementedError                       Traceback (most recent call last)
<ipython-input-82-d517da814a22> in <module>
      6 G1[0, 0] = -1
      7 x = np.zeros((10,5))
----> 8 G1[1:, 1:p+1] = x.astype("float32")

NotImplementedError: invalid type in assignment

这个 [特定] 错误可以通过以下方式纠正:

class SMWrapper(BaseEstimator, RegressorMixin):
    def __init__(self, alpha=0, lasso=True):
        self.alpha = alpha
        self.lasso = lasso
    def fit(self, X, y):
        # unpack weight from X
        self.model_ = WLS(y, X[:,:-1].astype("float64"), weights=X[:,-1]) # note astype
        if self.lasso:
            L1_wt = 1
        else:
            L1_wt = 0
        self.results_ = self.model_.fit_regularized(alpha=self.alpha, L1_wt=L1_wt, method='sqrt_lasso')
        return self
    def predict(self, X):
        return self.results_.predict(X[:,:-1])

但随后您会遇到另一个错误:check_complex_data(您可能会看到定义 here)

您面临的问题 check_estimator 对估算器(在您的情况下为 WLS)应该通过的检查过于严格。您可能会看到所有支票的列表:

from sklearn.utils.estimator_checks import check_estimator
gen = check_estimator(SMWrapper(), generate_only=True)
for x in iter(gen):
    print(x)

WLS 并未通过所有检查，例如复数检查(我们从第 2 行移至第 11 行)，但会在实践中处理您的数据，因此您可以接受它(或从头开始重新编码)。

编辑

一个有效的问题可以是“哪个测试运行，哪个失败”。为此，您不妨检查 https://scikit-learn.org/stable/auto_examples/release_highlights/plot_release_highlights_0_22_0.html#checking-scikit-learn-compatibility-of-an-estimator和 sklearn.utils.estimator_checks._yield_checks为您的估算器生成可用检查

编辑 2

v0.24 的替代方案可能是:

check_estimator(SMWrapper(), strict_mode=False)

关于python - 来自 statsmodels 的自定义估算器 WLS 的 sklearn check_estimator 错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64161389/

25

4

0

文章推荐： PHP在字符串文字中动态引用变量

文章推荐： python - 根据另一个系列，带有旗帜的新 Pandas 系列

文章推荐： Django 原子事务实际上不是原子的？

java - WLS - 如何处理交易
我正在使用 Weblogic 服务器，其中连接对象正在处理一个事务，其中同一个连接实例尝试使用不同的事务，然后现有事务无法完成并抛出事务错误，其中现有事务正在执行任何提交/回滚操作，而新事务还使用来自
java - 自定义库未部署到 WLS jDeveloper
我使用 jDeveloper 创建了一个自定义应用程序。在主项目中，我在类路径中创建了一个自定义库，其中包含了一些 jar 文件。我的项目编译正确。当我尝试运行 .java 文件(右键单击“运行”)
java - 我在哪里可以找到 wls-api.jar？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。关闭 8 年前。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。
java - 无法在 WLS 中使用 Logback
我需要在要部署在 WLS 中的 Web 应用程序项目中使用 log-back，我已在 WEB-INF 类文件夹中添加了 log-back。要选择我需要添加的 WEB-INF 类， true在 webl
weblogic - 任何可用于集群 Oracle WLS EJB 的注释？
正如标题中所说，我想知道是否有专有的 Oracle WLS 注释指定 EJB 将被集群。基本上相当于将它添加到您的 weblogic-ejb-jar.xml 中: True ra
docker - 同一主机上的多个 docker WLS 容器，使外部世界可以访问它们
我有一个运行 weblogic 的 docker 容器，其中部署了我们的一些应用程序 (EAR)。当这些 EAR 中的每一个启动时，它们都会向外部服务管理器组件注册自己。在注册时，会提供主机地址(使用
java - WLS 12.1.1 上的计时器
我在 Weblogic 12.1.1 上使用非持久计时器。问题是，有时在回调方法引发系统异常后，计时器不再执行(或仅执行一次)。即使使用带注释的 @Scheduled 方法以及以编程方式初始化的计时
java - 在外部 WLS 中打包和部署 ADF 应用程序时出现问题
我使用的是 JDeveloper 11.1.1.7.0，它具有嵌入式 10.3.5 WebLogic Server。当我通过右键单击页面并在嵌入式 WLS 中运行...来测试应用程序时，一切都运行良
python - "statsmodels.regression.linear_model. WLS"是如何工作的？
我使用“statsmodels.regression.linear_model”来做 WLS。但我不知道如何为我的回归赋予权重。有谁知道权重是如何给出的以及它是如何工作的？ import nump
python - statsmodels WLS 有 get_influence() 函数吗？
如何从适合 python statsmodels 的 WLS 模型中获得杠杆率/get_influence 以 http://statsmodels.sourceforge.net/stable/in
weblogic - 覆盖 JMX 在 Docker WLS 容器中的工作方式
我有一个 WebLogic docker 容器。 WLS 管理端口配置为 7001。当我运行容器时，我使用 --hostname=[hosts' hostname] 并使用 -p 8001:7001
maven - wls-maven-插件 :deploy shared library
我已经从 weblogic-maven-plugin (10.3) 迁移到 wls-maven-plugin(12.1) 并遇到了部署共享库的问题。问题是 wls-maven-plugin 不传递给
在 WLS 12 中部署应用程序时出现 java.lang.ArrayIndexOutOfBoundsException
我在 Weblogic 中部署应用程序时收到此错误。 (ClassInfoImpl.java:45) at weblogic.application.utils.anno
在 WLS 12 中部署应用程序时出现 java.lang.ArrayIndexOutOfBoundsException
我在 Weblogic 中部署应用程序时遇到此错误。 (ClassInfoImpl.java:45) at weblogic.application.utils.anno
python - 如何从 statsmodels 中 WLS 回归的 2D 参数获取测试预测
我正在逐步提高 WLS regression functions 的参数使用统计模型。我有一个 10x3 数据集 X，我声明如下: X = np.array([[1,2,3],[1,2,3],[4,
java - WLS 10客户端抛出类未找到异常(org.apache.openjpa.enhance.PersistenceCapable)
我正在使用 WLS 10 开发应用程序当我尝试从我的耳朵应用程序的特定 jar 连接(查找)到 EJB 时，在客户端中抛出类“org.apache.openjpa.enhance.Persistenc
java - Linux 中的 WLS 12.1.3 - 消息未被消费者收听
我已将代码部署为 WAR文件在 WebLogic Server (WLS) 12.1.3 我正在从生产者发送消息，消息由以下代码使用。该应用程序作为 WAR 文件部署在 Windows 的 WLS 服
python - 来自 statsmodels 的自定义估算器 WLS 的 sklearn check_estimator 错误
我创建了 sklearn 自定义估计器(statsmodels.regression.linear_model.WLS with Lasso)以使用交叉验证。 check_estimator() 报告
java - ClassLoader [com.bea.wls.redef.RedefiningClassLoader] 不提供 'addTransformer(ClassFileTransformer)' 方法
当我尝试将 weblogic.xml 中启用 fast-swap 模式的分解目录部署到 weblogic 10.3 时，出现以下异常如果我删除
java - WLS 10.3.4 - 在范围 xxx_EJB.jar 中没有名为 'xxx' 的持久性单元可用。可用持久化单元 : []
我有一个包含 4 个模块的企业应用程序项目。它部署在 WLS 10.3.4 上。我正在使用 eclipse helios 与用于 eclipse 的 oracle web 工具进行开发。我机器上的本地

首页

博学

6Ren·AI

商城

python - 来自 statsmodels 的自定义估算器 WLS 的 sklearn check_estimator 错误