gpt4 book ai didi

python - MiniBatchKMeans Python

转载 作者:行者123 更新时间:2023-11-30 09:01:26 25 4
gpt4 key购买 nike

我正在使用 scikitlearn 中的 MiniBatchKMeans() 函数。出色地,在其文档中有:

batch_size : int, optional, default: 100 Size of the mini batches.

init_size : int, optional, default: 3 * batch_size Number of samples to randomly sample for speeding up the initialization (sometimes at the expense of accuracy): the only algorithm is initialized by running a batch KMeans on a random subset of the data. This needs to be larger than n_clusters.

我不太理解它,因为小批量的最终尺寸似乎是 3*batch_size 而不是 batch_size 参数指定的尺寸。

我是不是误会了什么?如果是这样,有人可以解释这两个论点。我是对的,为什么会有这两个论点,因为它们似乎是多余的。

谢谢!!!

最佳答案

批量大小由batch_size、句点定义。此外,您可以定义 init_size 这是用于初始化流程的样本大小,默认它是 3*batch_size。你可以简单地设置bath_size=100init_size=10,然后使用10个样本进行初始化(kmeans不是全局收敛的,网上有很多技术可以处理它)初始化阶段),稍后在算法执行期间将使用 100 批。

关于python - MiniBatchKMeans Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33039884/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com