gpt4 book ai didi

python - 在分割数据集时,为什么人们要遵循命名约定?

转载 作者:行者123 更新时间:2023-11-30 09:46:18 25 4
gpt4 key购买 nike

X_train, X_test, y_train, y_test = \
train_test_split(X, y, test_size=0.30, random_state=1)

在此示例中 (X_train, X_test) X 提到为大写,其中(y_train, y_test) 这里y以小写形式提及。

是否有任何令人信服的理由来遵循该命名约定?

最佳答案

这是因为您有多个特征(输入)和一个响应变量(输出)的情况​​。然后,输入 X 是一个具有 number_of_features 列和 number_of_samples 行的矩阵,输出 y 是一列具有 number_of_samples 元素的向量。遵循数学和/或相关领域广泛使用的用大写字母命名矩阵和用小写字母命名向量的约定,X 必须为大写,y 必须为大写,这是有道理的。 code> 必须小写。

如果您只有一个特征,因此输入是列向量而不是矩阵,则 x 应为小写。如果您有多个响应变量并且输出是矩阵,则 Y 应为大写。

最后,使用比 Xy 更具描述性的名称始终是一个好主意。然后,遵循 PEP 8 约定 uf 使用 Snake_case 作为变量名称 - 或您遵循的风格指南建议的任何内容 - 就是正确的方法。

关于python - 在分割数据集时,为什么人们要遵循命名约定?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52237376/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com