gpt4 book ai didi

python - 以分号作为分隔符读取 CSV 文件

转载 作者:太空宇宙 更新时间:2023-11-03 13:10:46 26 4
gpt4 key购买 nike

我有一个 numpy 二维数组,其形状为 (4898, ),其中每行中的元素由 分号 但仍存储在单列中而不是多列中(期望的结果)。如何在二维数组的每个数组中每次出现分号时创建拆分。我已经编写了以下 Python 脚本来执行此操作,但它会引发错误。

stochastic_gradient_descent_winequality.py

import numpy
import pandas

if __name__ == '__main__' :

with open('winequality-white.csv', 'r') as f_0 :
with open('winequality-white-updated.csv', 'w') as f_1 :
f_0.next()
for line in f_0 :
f_1.write(line)


wine_data = pandas.read_csv('winequality-white-updated.csv', sep = ',', header = None)
wine_data_ = wine_data
wine_data = numpy.array([x.split(';') for x in wine_data_], dtype = numpy.float)

print (numpy.shape(wine_data))

错误

Traceback (most recent call last):
File "stochastic_gradient_descent_winequality.py", line 16, in <module>
wine_data = numpy.array([x.split(';') for x in wine_data_], dtype = numpy.float)
AttributeError: 'numpy.int64' object has no attribute 'split'

最佳答案

如果您使用分号 (;) 而不是逗号 (,) 作为 csv 文件分隔符,您可以调整第一行:

wine_data = pandas.read_csv('winequality-white-updated.csv', sep = ';', header = None)

您的列表理解的问题是 [x.split(';') for x in wine_data_] 迭代列名

在这种情况下,您不需要使用列表推导式。您可以读入数据并完成。

wine_data = pandas.read_csv('winequality-white-updated.csv', sep = ',', header = None)
print (numpy.shape(wine_data))

关于python - 以分号作为分隔符读取 CSV 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44195394/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com