gpt4 book ai didi

python - 从 .txt 文件发出读取数组

转载 作者:太空宇宙 更新时间:2023-11-04 10:42:17 24 4
gpt4 key购买 nike

我正在尝试从 Python 中的 txt 文件导入和排列。

该文件是一堆数组或“列表”我不确定术语基本上每个数组包含 15 到 30 左右的不同数量的整数。

我尝试的任何方法都只读取每行,但这对我不起作用,因为一个数组跨越 4 行,我需要读取每个数组作为一个整体。

数据格式如下:

  9     10     11     12     13     14     15     16     17     18
19 20 21 22 23 24 89 90 91 92
93 94 95 96 8447 8448 8449 8450 8451 845
8453 8454 8488 8489 8490 164624 164625 164626 164627 164628
164629

13 14 15 16 17 18 19 20 21 22
23 24 25 26 27 28 91 92 93 94
95 96 97 98 8449 8450 8451 8452 8453 8454
8455 8456 8488 8489 8490 8491 164626 164627 164628 164629
164630 164631 164632 164633 164666 164667 164668

17 18 19 20 21 22 23 24 25 26
27 28 29 30 31 32 93 94 95 96
97 98 99 100 8451 8452 8453 8454 8455 8456
8457 8458 8489 8490 8491 8492 164628 164629 164630 164631
164632 164633 164634 164635 164666 164667 164668

21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 95 96 97 98
99 100 101 102 8453 8454 8455 8456 8457 8458
8459 8460 8490 8491 8492 8493 164630 164631 164632 164633
164634 164635 164636 164667 164668 164669 164670

我是生成此文件的人,因此我可以更改它以使其更简单。

我试过了-

readlines genfromtxt loadtxt

任何我能找到的任何输出,每行输出,所以第一个条目是:

9 10 11 12 13 14 15 16 17 18

相对于:

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 89 90 91 92 93 94 95 96 8447 8448 8449 8450 8451 845 8453 8454 8488 8489 8490 164624 164625 164626 164627 164628 164629

这是用于生成输出文件的代码:

for i in c_array:
n_array = []
for j in i:
for k in range(8):
a = []
sorted_c_array = sorted_c_arrays[k]
c_col = sorted_c_array[:,k]
b = (binarySearch(c_col,j,sorted_c_array))
if b == True:
n_array.append(np.array(a))
else:
continue
n_array = np.reshape(n_array,(1,(np.size(n_array))))
n_array = np.unique(n_array)
output.writelines(str(n_array).replace(']',']\n')) code here

使用这个:

c_array = []
a = []
for l in file("C:/Users/09432191/SkyDrive/Masters/python/Finished programs/Pre- Prosessing/current_conectivity2.dat"):
line = l.strip()
if l == "\n" :
c_array.append(a)
a = []
a.append(line)

print c_array[0]

虽然我不知道如何摆脱不需要的字符:

['[     9     10     11     12     13     14     15     16     17     18', '19     20     21     22     23     24     89     90     91     92', '93     94     95     96   8447   8448   8449   8450   8451   8452', '8453   8454   8488   8489   8490 164624 164625 164626 164627 164628', '164629]']

最佳答案

如果你只需要用 Numpy 访问文件,你可以使用 np.savenp.load。这以更方便的格式存储数据:不需要从整数到字符串的转换,反之亦然,这比使用文本文件快得多。代码也变得非常简单明了:

import numpy as np

arr = np.random.randint(1, 200000, (180000, 47))

np.save('test.npy', arr) # 250 milisec on my system
loaded_arr = np.load('test.npy') # 55 milisec on my system


# alternatively using text based files:
np.savetxt('test.txt', arr) # 19 seconds
loaded_arr = np.loadtxt('test.txt', dtype=np.int) # 32 seconds

这样你就没有 180000 个单独的数组,而是一个大数据结构,你可以在其中通过切片访问每个(子)数组。然而,当您保存数据时,它也应该是一个单一的二维数组,但调整您的代码以这种格式保存数据应该不难(如果每个子数组至少具有相同的大小)。

关于python - 从 .txt 文件发出读取数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19809978/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com