gpt4 book ai didi

python-3.x - X的imputer = imputer.fit(X [:,1:3])代表什么?imputer.fit(X [:,1:3])的含义是什么?

转载 作者:行者123 更新时间:2023-12-03 12:30:36 25 4
gpt4 key购买 nike

我正在对数据集进行预处理,我得到了该行的错误原因
imputer = imputer.fit(X [:,1:3])。我不明白哪个?我理解imputer = Imputer(missing_values =“ NaN”,strategy =“ mean”),意味着用列和行中的均值替换缺失值。然后,我们是否要使模型适合数据,这是我不明白的?


import pandas as pd
from sklearn import svm
import matplotlib.pylot as plt %matplotlib inline

from sklearn.preprocessing import Imputer
import seaborn as sns; sns.set(font_scale=1.2)

stock=pd.read_csv("C:/Users/Dulangi/Downloads/winequality-red.csv")
stock.head()

g=sns.lmplot('alcohol','quality',data=stock,height=7, truncate=True, scatter_kws={"s":100})
imputer = Imputer(missing_values = "NaN", strategy = "mean", axis = 0)

imputer = imputer.fit(X[:,1:3])



我得到的错误


NameError Traceback (most recent call last)
<ipython-input-4-620c08822929> in <module>
14 imputer = Imputer(missing_values = "NaN", strategy = "mean", axis = 0)
15
---> 16 imputer = imputer.fit(X[:,1:3])

NameError: name 'X' is not defined

NameError Traceback (most recent call last)
<ipython-input-4-620c08822929> in <module>
14 imputer = Imputer(missing_values = "NaN", strategy = "mean", axis = 0)
15
---> 16 imputer = imputer.fit(X[:,1:3])

NameError: name 'X' is not defined

最佳答案

我们使用sci-kit库中的imputer,即填充缺失值,我们使用数据集中所考虑列的均值或众数填充缺失值。

在[:,1:3]中,逗号前面的左侧表示选择数据集中的所有行,您甚至可以指定要选择的行范围,而不是:比如我们说1:10,然后选择前10个行。

逗号后的右侧表示从1:3开始选择第3列,我们甚至可以说:表示选择所有列。

然后,拟合将实际存储在训练数据集上计算出的均值或众数,使用我们分配的策略来填充缺失值,然后在转换过程中将其用于测试数据。

引用这些以获得更好的主意

https://www.youtube.com/watch?v=fCMrO_VzeL8&t=515s

https://www.youtube.com/watch?v=oH3wYKvwpJ8&t=1s

https://medium.com/@kanchanardj/jargon-in-python-used-in-data-science-to-laymans-language-part-two-98787cce0928

关于python-3.x - X的imputer = imputer.fit(X [:,1:3])代表什么?imputer.fit(X [:,1:3])的含义是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57898696/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com