python - sklearn 管道 - 在管道中应用多项式特征变换后应用样本权重-6ren

python - sklearn 管道 - 在管道中应用多项式特征变换后应用样本权重

转载作者：太空狗更新时间：2023-10-29 20:49:25

24

4

我想应用样本权重，同时使用 sklearn 的管道，它应该进行特征转换，例如多项式，然后应用回归量，例如额外的树。

我在下面的两个示例中使用了以下包:

from sklearn.ensemble import ExtraTreesRegressor
import numpy as np
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures

只要我单独转换特征并随后生成和训练模型，一切都会很好:

#Feature generation
X = np.random.rand(200,4)
Y = np.random.rand(200)

#Feature transformation
poly = PolynomialFeatures(degree=2)
poly.fit_transform(X)

#Model generation and fit
clf = ExtraTreesRegressor(n_estimators=5, max_depth = 3)
weights = [1]*100 + [2]*100
clf.fit(X,Y, weights)

但是在管道中执行它是行不通的:

#Pipeline generation
pipe = Pipeline([('poly2', PolynomialFeatures(degree=2)), ('ExtraTrees', ExtraTreesRegressor(n_estimators=5, max_depth = 3))])

#Feature generation
X = np.random.rand(200,4)
Y = np.random.rand(200)

#Fitting model
clf = pipe
weights = [1]*100 + [2]*100
clf.fit(X,Y, weights)

我收到以下错误:TypeError: fit() takes at most 3 arguments (4 given)在这个简单的例子中，修改代码没有问题，但是当我想在我的真实代码中对我的真实数据运行几个不同的测试时，能够使用管道和样本权重

最佳答案

Pipeline的fit方法中提到了**fit_params文档。您必须指定要将参数应用到管道的哪个步骤。您可以按照文档中的命名规则来实现:

For this, it enables setting parameters of the various steps using their names and the parameter name separated by a ‘__’, as in the example below.

综上所述，尝试将最后一行更改为:

clf.fit(X,Y, **{'ExtraTrees__sample_weight': weights})

This is a good example如何在管道中使用参数。

关于python - sklearn 管道 - 在管道中应用多项式特征变换后应用样本权重，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36205850/

24

4

0

文章推荐： c# - 为什么 callvirt IL 指令会导致虚方法中的递归调用？

文章推荐： c++ - 更自然的 boost::bind 替代方案？

文章推荐： c# - 带有 C# 的 ASP.net 在回发时保留列表

文章推荐： c++ - 来自绑定(bind)方法的原始函数指针

java - 可因式分解的三项式/多项式
所以我想创建一个程序，当用户输入值 c 且 a = 1 时，打印出可因式分解的二次方程。程序应确定 b 的所有可能的整数值，以便三项式以 x^2 + bx + c 的形式打印出来一个例子是，如果用户
math - Python 多项式 pow
我有自己定义的多项式类，它是系数列表的形式。有点像 axˆ2 + bx + c is equals to [c, b, a] (for ax + b == [b, a] similarly, for
java - 多项式 GUI 不起作用
我必须制作一个对多项式执行运算的 GUI，但我不断收到无法摆脱的 NullPointerExceptions。在输出上它没有显示任何内容。我尝试调试我的程序，据我所知，我从键盘插入的多项式在某种程度上
python - 在其他多项式上评估 numpy 多项式
numpy.lib.polynomial.polyval 允许您使用另一个多项式评估多项式: numpy.polyval(poly1d([1, 2, 3]), 2) Out[832]: 11 nump
c - 参数、多项式、C
如果我想计算多项式，如何在 C 中定义具有可变数量参数的函数？我的函数必须有这个参数:第一个参数:float x，第二个:int n，其余的 float (系数)。非常感谢! 最佳答案用 varia
C++ 多项式 : indefinite integrals
我正在尝试求多项式的不定积分，但是我的数学和编码都不是很好。我的代码可以编译，但我相信我的公式有误: Polynomial Polynomial :: indefiniteIntegral() co
c# - 曲线拟合具有可变幂的 3D 多项式
我有 3 个数据集。 2 表示多项式本身(我们称它们为 x 和 y)，1 表示函数值(它将是 z)。多项式看起来像这样(假设两个维度的幂都是 3): z = a00 + a01*x + a02*x^
python - python中的多元(多项式)最佳拟合曲线？
如何在 python 中计算最佳拟合线，然后将其绘制在 matplotlib 中的散点图上？我使用普通最小二乘回归计算线性最佳拟合线如下: from sklearn import linear_mo
python sympy 不能很好地分解 bool 多项式
我正在尝试分解 bool 多项式以获得逻辑网络的最小形式。我的变量是 a1、a2、a3 ... 以及负对应项 na1、na2、na3 ... 如果需要一个函数 f = a1*a2*b2*nb1 + a
c# - 使用表达式树构建 Func 多项式
长话短说如何使用系数数组构建表达式并将其转换为 Func ？有没有比表达式树更好的方法？我有一个使用 Func formula 构造的不可变序列类型用于为序列 A 生成术语 An。我开始构建一个辅
apache-spark - Spark 多项式 Logistic 回归的意外系数
我在我的 Mac OS Sierra 上运行 Spark 2.1.1(这应该有帮助)。我尝试在网上找到的测试数据集上拟合多项式逻辑回归，我在此处报告前几行(我不知道如何在此处附加文件): 1,0,24
c++ - C++ 中的链表、多项式、重载运算符 << 和 >>
我必须构建一个从类 lista(列表)继承的类多项式(polinom)。我必须从多项式类中加、减、乘、除 2 个对象。我有这段代码。我不明白为什么我的析构函数不工作。我还必须重载运算符:+、-、> 但
c++ - 多项式++ : How to increment p(x) by 1
我有一个 Polynomial类，我正在尝试定义 operator++ ，递增前和递增后，以及尝试定义递减前和递减后，即 operator-- .这是我的代码片段: class Polynomial
python - 在 Python 中求解一个困难的(多项式？)方程
我是编程新手(Python 是我的第一语言)，但我喜欢设计算法。我目前正在研究方程组(整数)，但找不到任何解决我的特定问题的引用。让我解释一下。我有一个等式(一个测试，如果你愿意的话): raw_
python - scipy 多项式 pmf 返回 nan
我正在尝试使用 scipy.stats (python) 中的 multinominal.pmf 函数。当我在输入中所有概率都大于零的情况下使用此函数时，它工作正常。问题是当我想在其中一个概率为零时
java - CRC-16 与 0xA001 多项式
我想用 0xA001 多项式计算字节数组的 CRC-16 校验和。但我真的不知道如何在 Java 中做到这一点，以及如何使用给定的多项式。它是某种特殊值(0xA001)吗？你能告诉我一个可以为我计算校
python - SkLearn 多项式 NB : Most Informative Features
由于我的分类器在测试数据上产生了大约 99% 的准确率，我有点怀疑并想深入了解我的 NB 分类器最有用的特征，看看它正在学习什么样的特征。以下主题非常有用:How to get most inform
r - 多项式 logit : estimation on a subset of alternatives in R
如 McFadden (1978)表明，如果多项 logit 模型中的备选方案数量大到无法计算，则通过对备选方案进行随机子集来获得一致估计仍然是可行的，因此每个个体的估计概率基于所选备选方案和 C其他
python - 如何从 scipy.interpolate.splprep() 中提取函数模型(多项式)？
我现在有一些离散点，我使用 scipy.interpolate.splprep () 函数(B 样条插值)对其进行插值，以获得令人满意的平滑曲线。这是代码(借鉴另一个问题的答案)和我得到的结果。 im
python - IPython notebook 中 pretty-print 多项式
我在 IPython notebook 中有一些多项式 x: import numpy as np x = np.polynomial.polynomial.Polynomial([1,2,3]) x

首页

博学

6Ren·AI

商城

python - sklearn 管道 - 在管道中应用多项式特征变换后应用样本权重