gpt4 book ai didi

python - 使用 Pandas 创建 NumPy 数组

转载 作者:太空宇宙 更新时间:2023-11-04 03:26:58 25 4
gpt4 key购买 nike

我正在尝试将 scikit 与一个电子表格 (.xlsx) 中的一些数据结合使用。为此,我使用 Pandas 读取电子表格,然后使用 numpy 来使用 scikit。

这里的问题是,当我将我的 DF 结构转换为 numpy 时,我几乎丢失了所有数据!我认为这是因为它没有列名。只有原始数据。例如:

28.7967 16.0021 2.6449 0.3918 0.1982

31.6036 11.7235 2.5185 0.5303 0.3773

162.052 136.031 4.0612 0.0374 0.0187

到目前为止我的代码:

def split_data():
test_data = pd.read_excel('magic04.xlsx', sheetname=0, skip_footer=16020)
#code below prints correctly the data
print test_data.iloc[:, 0:10]

#none of the code below work as expected
test1 = np.array(test_data.iloc[:, 0:10])
test2 = test_data.as_matrix()

我真的迷路了。非常欢迎任何帮助...

最佳答案

我建议您在 read_excel 中使用 header=None。请参阅以下内容:

df = pd.read_excel('stuff.xlsx')
>> df
28.7967 16.0021 2.6449 0.3918 0.1982
0 31.6036 11.7235 2.5185 0.5303 0.3773
1 162.0520 136.0310 4.0612 0.0374 0.0187

>> df.ix[:, 1: 2]

0
1

对比:

df = pd.read_excel('stuff.xlsx', header=None)
>> df

0 1 2 3 4
0 28.7967 16.0021 2.6449 0.3918 0.1982
1 31.6036 11.7235 2.5185 0.5303 0.3773
2 162.0520 136.0310 4.0612 0.0374 0.0187

>> df.ix[:, 1: 2]
1 2
0 16.0021 2.6449
1 11.7235 2.5185
2 136.0310 4.0612

关于python - 使用 Pandas 创建 NumPy 数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32673960/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com