gpt4 book ai didi

python - StandardScaler 变换后可接受的均值和标准差偏移量是多少?

转载 作者:行者123 更新时间:2023-12-04 15:07:29 27 4
gpt4 key购买 nike

我正在使用 sklearn StandardScaler 来转换/规范化数据,如下所示:

scaler = StandardScaler()
data = scaler.fit_transform(data)

我期望平均值为 0,标准差为 1。但是,我得到的值有点不同。

rnd = randrange(0, data.shape[1])
print(data[:,rnd].std())
print(data[:,rnd].mean())

1.0282903146389404
-0.06686584736835668

好像very close numbers to 0 and 1 should be acceptable ;但是,不确定可接受的偏移量是多少。例如,+/- 1e-2,正如我得到的那样,是否足够接近?还是我应该担心?

最佳答案

您正在为您的数据 变量使用fit_transform。这意味着,现在,您的所有数据都将归一化,遵循均值 0 和标准差 1 的形状。如下图所示:

enter image description here

您接下来要做的是,随机获取您的数据变量的一些样本。因此,您收集的新样本几乎完全相同,但是,由于存在随机参数,均值和标准差将与您的数据不同。

为了进行比较,假设我们有人类高度的平均值和标准差。如果我们现在对您所在国家/地区的高度进行小样本抽样,则平均值和标准差不会完全相同,但差不多。这就是重点。

确定如果您检查数据变量的均值和标准差,您将获得均值 0 和标准差 1。

关于python - StandardScaler 变换后可接受的均值和标准差偏移量是多少?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65837923/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com