gpt4 book ai didi

python - 如何从 .csv 文件中拆分数据集以进行训练和测试?

转载 作者:太空狗 更新时间:2023-10-29 22:05:23 24 4
gpt4 key购买 nike

我正在使用 Python,我需要将我的 .csv 导入数据分成两部分,训练集和测试集,例如 70% 的训练和 30% 的测试。

我一直收到各种错误,例如 'list' object is not callable 等等。

有什么简单的方法可以做到这一点吗?

谢谢

编辑:

代码很基础,我只是想拆分数据集。

from csv import reader
with open('C:/Dataset.csv', 'r') as f:
data = list(reader(f)) #Imports the CSV
data[0:1] ( data )

TypeError: 'list' 对象不可调用

最佳答案

你可以使用pandas:

import pandas as pd
import numpy as np

df = pd.read_csv('C:/Dataset.csv')
df['split'] = np.random.randn(df.shape[0], 1)

msk = np.random.rand(len(df)) <= 0.7

train = df[msk]
test = df[~msk]

关于python - 如何从 .csv 文件中拆分数据集以进行训练和测试?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43697240/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com