gpt4 book ai didi

python - 拆分测试集后如何使用 Pandas 数据框?

转载 作者:行者123 更新时间:2023-11-28 22:34:47 24 4
gpt4 key购买 nike

我最近学习了如何对我的 pandas 数据框进行验证拆分,但拆分后我发现我无法对列进行切片。

print(my_data['column name']) 

它抛出一个错误,请帮助。

我的代码是这样的:

import pandas as pd  
from sklearn.cross_validation import train_test_split
data = pd.read_csv("labeledTrainData.tsv" , header = 0 , \
delimiter = '\t' , quoting = 3)

train , test = train_test_split(data , train_size = 0.8 , random_state = 38)
print(len(train['sentiment']))

请问numpy是否也遇到这个问题?

最佳答案

train_test_split返回拆分列表,您应该使用这些来索引 df:

X_train, X_test, y_train, y_test =train_test_split(data , train_size = 0.8 , random_state = 38)

然后你像这样索引:

data.iloc[X_train]
data.iloc[X_test]
data.iloc[y_train]
data.iloc[y_test]

关于python - 拆分测试集后如何使用 Pandas 数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38743888/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com