gpt4 book ai didi

python - pandas.to_csv 函数的额外分隔符

转载 作者:行者123 更新时间:2023-12-01 04:38:53 24 4
gpt4 key购买 nike

我有一个数据集,我试图将其拆分为训练集和测试集。我制作了以下脚本来分割数据,如上所述:

import pandas as pd
import numpy as np

data_path = "/path_to_data/"

df = pd.read_csv(data_path+"product.dlm", header=0, delimiter="|")
ts = df.shape
# print "data dimension", ts
# print "product attributes \n", train.columns.values


#shuffle data set, and split to train and test set.
new_train = df.reindex(np.random.permutation(df.index))

indice_90_percent = int((ts[0]/100.0)* 90)


new_train[:indice_90_percent].to_csv('train_products.txt',header=True, sep="|")
new_train[indice_90_percent:].to_csv('test_products.txt',header=True, sep="|")

原始文件看起来像

label1|label2|...|labeln
371658|description|...|"some value"

to_csv()生成的文件有一个额外的列在开头没有名称,看起来像这样

|label1|label2|...|labeln|
452488|422932|description|...|"some value"|

我错过了什么?

最佳答案

添加index=False解决了问题:

new_train[indice_90_percent:].to_csv('test_products.txt',header=True, sep="|", index=False)

关于python - pandas.to_csv 函数的额外分隔符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31184329/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com