gpt4 book ai didi

python "Too many indices for array"

转载 作者:太空狗 更新时间:2023-10-30 01:00:12 25 4
gpt4 key购买 nike

我正在使用 pandas 在 python 中读取一个文件,然后将其保存在一个 numpy 数组中。该文件的尺寸为 11303402 行 x 10 列。我需要拆分数据以进行交叉验证,为此我将数据分成 11303402 行 x 9 列示例和 1 个 11303402 行 x 1 列标签数组。以下是代码:

tdata=pd.read_csv('train.csv')
tdata.columns='Arrival_Time','Creation_Time','x','y','z','User','Model','Device','sensor','gt']

User_Data = np.array(tdata)
features = User_Data[:,0:9]
labels = User_Data[:,9:10]

错误出现在以下代码中:

classes=np.unique(labels)
idx=labels==classes[0]
Yt=labels[idx]
Xt=features[idx,:]

线上:

Xt=features[idx,:]

它说'数组的索引太多'

所有3个数据集的形状是:

print np.shape(tdata) = (11303402, 10)
print np.shape(features) = (11303402, 9)
print np.shape(labels) = (11303402, 1)

如果有人知道这个问题,请帮忙。

最佳答案

问题是 idx 的形状为 (11303402,1),因为逻辑比较返回一个与 labels 形状相同的数组。这两个维度使用了 features 中的所有索引。快速解决方法是

Xt=features[idx[:,0],:]

关于 python "Too many indices for array",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37163047/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com