python - 我们可以直接使用 .fit

python - 我们可以直接使用 .fit_transform() 吗？

转载作者：太空宇宙更新时间：2023-11-04 02:33:00

26

4

from sklearn.preprocessing import MinMaxScaler()
scaler = MinMaxScaler()

我可以直接做吗:

scaled_data = scaler.fit_transform(mymatrix)

没有先做scaler.fit(mymatrix)？

如果不是，为什么会这样？有什么不同？ scaler.fit_transform() 函数在转换之前是否也已经计算了方差和平均值？

最佳答案

正如您在文档中看到的那样 here你可以，因为 fit_transform 首先执行 fit()， 然后它应用 transform()。

关于python - 我们可以直接使用 .fit_transform() 吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48681633/

26

4

0

文章推荐： c - C链表中的内存泄漏

文章推荐： c - 链表追加最后一次不起作用

文章推荐： python - 在 Pandas 数据框中转换matlab日期

python - 如何通过将元组更改为...来完成元组上的 fit_transform，或者能够完成数据上的 fit_transform？
所以第一个问题:我读到了这个错误，它说它是类型:元组，所以我很困惑错误是什么以及如何修复它。初学者，请大家给点详细的建议。尝试按照类似问题中的说明将 (df_x) 更改为 [df_x]，但没有成功。
python - 为什么 vectorizer.fit_transform(x).astype ('bool' ) 与 vectorizer.set_params(binary=True).fit_transform(x) 不同？
这是我正在谈论的一个最小的例子: import numpy as np from sklearn.datasets import fetch_20newsgroups from sklearn.fea
python - .fit_transform 方法的输出
我想更深入地了解 scikit learn 中 PolynomialFeatures 类中的 .fit_transform() 方法输出的内容。我知道该方法正在做两件事，1) 通过将数据拟合到回归算
python - fit_transform 后数组大小不同
我对 fit_transform 函数有疑问。有人可以解释为什么数组的大小不同吗？ In [5]: X.shape, test.shape Out[5]: ((1000, 1932), (1000,
python - LabelEncoder().fit_transform 给我负值？
嘿，我的数据集中的“城市”列中有不同的城市名称。我很想使用 LabelEncoder() 对其进行编码。然而，我得到了非常令人沮丧的负值结果 df['city_enc'] = LabelEncode
python - LabelEncoder().fit_transform 给我负值？
嘿，我的数据集中的“城市”列中有不同的城市名称。我很想使用 LabelEncoder() 对其进行编码。然而，我得到了非常令人沮丧的负值结果 df['city_enc'] = LabelEncode
python - 我们可以直接使用 .fit_transform() 吗？
from sklearn.preprocessing import MinMaxScaler() scaler = MinMaxScaler() 我可以直接做吗: scaled_data = scal
python - LabelEncoder fit_transform() 函数中的问题
尝试执行以下代码时出现以下错误。 class LabelOneHotEncoder(): def __init__(self): self.ohe = OneHotEncode
python - StandardScalar Fit_Transform 出错
import numpy as np import matplotlib.pyplot as plt import pandas as pd dataset = pd.read_csv('Pos
python - 与 TfidfVectorizer.fit_transform 的返回结果混淆
我想更多地了解 NLP。我遇到了这段代码。但是当打印结果时，我对 TfidfVectorizer.fit_transform 的结果感到困惑。我熟悉 tfidf 是什么，但我不明白这些数字是什么意思。
python - 为什么 TfidVectorizer.fit_transform() 会更改我的文本数据的样本和标签数量？
我有一个数据集，其中包含 3 列 310 条数据。这些列都是文本。第一列是用户在查询表单中输入的文本，第二列是标签(六个标签之一)，说明输入属于哪个查询类别。 >>> data.shape (310
python - 数据框 fit_transform 抛出错误，看似不正确的错误
我正在 Python 中运行给定的行: df = df.apply(lambda x: d[x.name].fit_transform(x)) 并出现以下错误: ~/anaconda3/envs/py
python sklearn : fit_transform() does not work for GridSearchCV
我正在创建一个 GridSearchCV 分类器作为 pipeline = Pipeline([ ('vect', TfidfVectorizer(stop_words='english',s
python - 属性错误 : 'RandomForestClassifier' object has no attribute 'fit_transform'
我遇到了一个错误 AttributeError: 'RandomForestClassifier' object has no attribute 'fit_transform' 但是，sklearn
python-2.7 - 二次特征化器 : preprocessing with fit_transform
以下示例是用 Python 编写的，摘自书籍 Mastering Machine Learning . 任务概述: 训练数据存储在列向量X_train(特征)和y_train(响应变量)中用于测试目
machine-learning - Scikit learn - 测试集上的 fit_transform
我正在努力通过 Scikit learn 在 Python 中使用随机森林。我的问题是我用它进行文本分类(分为 3 类 - 正/负/中性)，我提取的特征主要是单词/一元组，所以我需要将它们转换为数字特
python - vectorizer fit_transform 如何在 sklearn 中工作？
我试图理解下面的代码 from sklearn.feature_extraction.text import CountVectorizer vectorizer = CountVectorizer(
python - LabelEncoder().fit_transform 与用于分类编码的 pd.get_dummies
最近我注意到，如果你有一个像这样的数据框df: A B C 0 0 Boat 45 1 1 NaN 12 2 2 Cat 6 3 3 Moose
python - scikit learn 的 fit_transform 是否也会转换我的原始数据框？
我正在使用 scikit 学习的 StandardScaler() 并注意到在我应用 transform(xtrain) 或 fit_transform(xtrain) 之后，它也会更改我的 xtra
python-3.x - 使用 LabelEncoder.fit_transform() 输入错误
我在 Kaggle ( https://www.kaggle.com/c/titanic/data ) 上使用泰坦尼克号数据集，我想使用 sklearn.preprocessing 中的 LabelE

首页

博学

6Ren·AI

商城

python - 我们可以直接使用 .fit_transform() 吗？