gpt4 book ai didi

python - 使用循环从 CSV 获取数据数组

转载 作者:行者123 更新时间:2023-11-28 22:39:20 25 4
gpt4 key购买 nike

我有一个如下所示的 CSV:

0.500187550,CPU1,7.93
0.500187550,CPU2,1.62
0.500187550,CPU3,7.93
0.500187550,CPU4,1.62
1.000445359,CPU1,9.96
1.000445359,CPU2,1.61
1.000445359,CPU3,9.96
1.000445359,CPU4,1.61
1.500674877,CPU1,9.94
1.500674877,CPU2,1.61
1.500674877,CPU3,9.94
1.500674877,CPU4,1.61

第一列是时间,第二列是使用的 CPU,第三列是能量。

作为最终结果,我想要这些数组:

时间:

[0.500187550, 1.000445359, 1.500674877]

能量(每个 CPU):例如CPU1

[7.93, 9.96, 9.94]

为了解析我正在使用的 CSV:

query = csv.reader(csvfile, delimiter=',', skipinitialspace=True)
#Arrays global time and power:
for row in query:
x = row[0]
x = float(x)
x_array.append(x) #column 0 to array
y = row[2]
y = float(y)
y_array.append(y) #column 2 to array
print x_array
print y_array

通过这种方式,我将时间和能量的所有数据放入两个数组:x_arrayy_array

然后我对数组进行排序:

energy_core_ord_array = []
time_ord_array = []
#Dividing array into energy and time per core:
for i in range(number_cores[0]):
e = 0 + i
for j in range(len(x_array)/(int(number_cores[0]))):
time_ord = x_array[e]
time_ord_array.append(time_ord)
energy_core_ord = y_array[e]
energy_core_ord_array.append(energy_core_ord)
e = e + int(number_cores[0])

最后,我将时间数组切割成它应该具有的长度:

final_time_ord_array = []
for i in range(len(x_array)/(int(number_cores[0]))):
final_time_ord = time_ord_array[i]
final_time_ord_array.append(final_time_ord)

到这里为止,虽然代码不优雅,但是可以用。当我尝试为每个核心获取数组时,问题就来了。

我为第一个核心获得它,但是当我尝试为下一个核心迭代时,我不知道该怎么做,以及如何将每个数组存储在一个具有单个名称的变量中。

final_energy_core_ord_array = []
#Trunk energy core array:
for i in range(len(x_array)/(int(number_cores[0]))):
final_energy_core_ord = energy_core_ord_array[i]
final_energy_core_ord_array.append(final_energy_core_ord)

最佳答案

所以使用 Pandas(用 Python 处理数据帧的库)你可以做这样的事情,这比你正在做的尝试手动处理 CSV 要快得多:

import pandas as pd

csvfile = "C:/Users/Simon/Desktop/test.csv"

data = pd.read_csv(csvfile, header=None, names=['time','cpu','energy'])

times = list(pd.unique(data.time.ravel()))

print times

cpuList = data.groupby(['cpu'])

cpuEnergy = {}

for i in range(len(cpuList)):
curCPU = 'CPU' + str(i+1)
cpuEnergy[curCPU] = list(cpuList.get_group('CPU' + str(i+1))['energy'])

for k, v in cpuEnergy.items():
print k, v

这将给出以下输出:

[0.50018755000000004, 1.000445359, 1.5006748769999998]
CPU4 [1.6200000000000001, 1.6100000000000001, 1.6100000000000001]
CPU2 [1.6200000000000001, 1.6100000000000001, 1.6100000000000001]
CPU3 [7.9299999999999997, 9.9600000000000009, 9.9399999999999995]
CPU1 [7.9299999999999997, 9.9600000000000009, 9.9399999999999995]

关于python - 使用循环从 CSV 获取数据数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34875407/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com