python - Scikit Learn Pipeline 的自定义变压器-6ren

python - Scikit Learn Pipeline 的自定义变压器

转载作者：行者123 更新时间：2023-11-30 08:54:15

24

4

我正在使用 Scikit 学习管道对象，因为我要执行一系列任务(上采样、特征选择、分类)。我的上采样方法是自定义方法，这意味着我必须为管道实现自定义转换器。

变压器必须具有变换和拟合方法。当然，我只想对训练数据进行上采样，而不是对测试数据进行上采样。这是否意味着我只需实现 fit 方法，而不需要实现转换方法(对传递给 fit 方法的数据集进行上采样)？据我了解，变换方法适用于训练集和测试集......

最佳答案

scikit-learn 转换器无法更改样本数量，API 不支持此功能 - 请参阅 http://scikit-learn.org/stable/modules/generated/sklearn.base.TransformerMixin.html#sklearn.base.TransformerMixin.fit_transform - 记下 X、y 和 X_new 的尺寸。另请注意，它们仅返回 X，而不返回 y - 这意味着如果您更改 X 维度，它将不再匹配 y 维度。

一种方法是在管道之外运行它 - 生成用于训练的新样本并将其放入管道，并且不生成用于测试的新样本。但它不会工作，例如通过交叉验证。

为了使其适用于交叉验证和模型选择，您需要一个自定义 Pipeline 类，该类支持更改 n_samples 的转换器。例如，可以在 imbalanced-learn 中找到实现。封装:见here 。检查这个包 - 如果您需要上采样，那么您的上采样方法可能已经在不平衡学习中实现。

关于python - Scikit Learn Pipeline 的自定义变压器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41875694/

24

4

0

文章推荐： javascript - 使用 innerHTML 创建 div 后无法收听悬停(等)事件

文章推荐： javascript - 如何安全地传递 javascript？

文章推荐： machine-learning - 训练 SyntaxNet 需要多少数据？

haskell - 无压缩单子(monad)变压器
streaming套餐优惠a zipsWith function zipsWith :: (Monad m, Functor h) => (forall x y. f x -> g y ->
dart - 包装用 Dart 变压器
我正在尝试制作也可以在程序包上运行的 Dart 转换器，但是我无法弄清楚当前的状态 class MyTransformer extends Transformer implements LazyTra
dart - 正确使用 Dart 变压器
我的pubspec.yaml文件中包含以下行 transformers: - di - polymer: entry_points: web/index.html di软件包作为依赖导
haskell - 偏向 Monad 变压器
我正在尝试从 attoparsec 解构 IResult monad分成几 block 。这是IResult data IResult t r = Fail t [String] String
monads - Monad 变压器 – 显式提升
我正在阅读现实世界 Haskell 中的 monad 转换器。在以下示例中，堆栈为 Writer在顶部State在Reader之上在IO之上。 {-# Language GeneralizedNewt
java - 单元测试不适用于 XSLT 变压器
我已经编写了单元测试用例来在我的 Mule 流程中单独测试消息处理器。但是单元测试失败并出现错误 org.mule.api.transformer.TransformerMessagingExcep
haskell - Monad 与 Monad 变压器
“Monads 允许程序员使用顺序构建 block 来构建计算”，因此它允许我们组合一些计算。如果是这样，那为什么下面的代码不能运行呢？ import Control.Monad.Trans.Stat
haskell - Monad 变压器 : IO and state
这个问题与其他地方已经涵盖的问题很接近，但我还没有找到任何专门解决这个问题的内容(至少不是以我能够理解的方式)。我想以取决于各种随机选择的方式更新状态。由于我正在使用 RandomSource 类型
java - 动态调用 Spring Integration 变压器
我是 Spring 集成新手，正在从事 SI 项目。我正在做一项简单的工作，从 channel (fromAdapter)获取消息，调用转换器并将输出发送到另一个 channel (toQueue)。
mysql - OrientDB 变压器 'jdbc' 未找到
我最近安装了 OrientDB 并尝试使用 ETL 模块创建导入。在 OS X 上运行，我使用自制软件安装了 orientDB。我创建了以下 ETL 脚本: { "config": {
c++ - 如何组合两个 Boost Geometry 变压器？
我有两个变压器，平移和旋转如下: namespace bg = boost::geometry; namespace trans = bg::strategy::transform; trans::t
python - 变压器 : cannot import name 'AutoModelWithLMHead' from 'transformers'
我指的是来自 stackoverflow 的这个答案，但我找不到关于我的问题的任何线索:[https://stackoverflow.com/questions/63141267/importerro
haskell - 类似 curl 的单子(monad)变压器？
我正在寻找一个 monad 转换器，我可以用它来发出 HTTP(等)类型的请求/响应。用途与 cURL 命令行工具类似。 [已编辑] 最佳答案嗯，有 curl包，它使用 IO monad。关于ha
haskell - 用于用 `Nothing` 发送无解决方案列表信号的 Monad 变压器
向哈斯凯勒同胞们问好。这是一个更大的约束满足问题的玩具版本，我是目前正在努力。下面的代码使用列表 monad 转换器来表示给定的正整数n作为不同小偶数的总和方法。 import Control.M
java - 添加两个 xml。使用 XSLT 变压器
我正在寻找一个让我很困扰的场景的解决方案。我正在开发 mule 3.3。我有一些传入的 XML 和来自丰富器的第二个 XML。现在，来自丰富器的 xml 将被添加到我的输入 XML 中。我的流
python - 变压器 : cannot import name 'AutoModelWithLMHead' from 'transformers'
我指的是来自 stackoverflow 的这个答案，但我找不到关于我的问题的任何线索:[https://stackoverflow.com/questions/63141267/importerro
java - 带 JXLS 2 的 SXSSF 变压器
我想将 SXSSF 转换器与 JXLS 一起使用。我试图以这样一种方式编写我的模板，即我不会得到“试图在已经写入磁盘的范围内写入一行”异常。该模板捕获已知列(例如“HEADER 0”)和未知列(以“_
java - 无法加载 XLS 变压器。请确保 Transformer 实现位于类路径中
早上好，我正在尝试复制此内容:http://jxls.sourceforge.net/getting_started.html 使用我自己的集体诉讼而不是员工。但我有一些问题。这是我的代码: pac
css - bundle 变压器 : CSS not bundled through @import directive
我们在 ASP.NET MVC 元素中使用 BundleTransformer 来 bundle 我们的样式文件。这很好用，但是我们注意到当我们使用 @import CSS at 规则在 LESS
nlp - 拥抱脸 pytorch 变压器 : how to initialize embeddings with certain values?
我正在微调来自 huggingface 的 bert 模型.有没有办法手动设置某个词块的初始嵌入？例如使单词“dog”的初始嵌入等于 torch.ones(768) .谢谢! 最佳答案您可以设置 B

首页

博学

6Ren·AI

商城

python - Scikit Learn Pipeline 的自定义变压器