gpt4 book ai didi

python - 如何解析多个 n 大小的数组中的单个 csv 文件列?

转载 作者:行者123 更新时间:2023-11-28 18:56:56 26 4
gpt4 key购买 nike

假设:

  1. 我们正在处理格式正确的 csv 文件。
  2. csv 文件包含单个列(因此文件中没有 , 只有 \n)
  3. 有可变数量的行

我的问题:考虑以下代码部分。

import csv
def ReadCsv(pathname, chunkSize):
with open(pathname) as file:
reader = csv.reader(file)
row_count = sum(1 for row in reader)
columnChucks = [] # This will be a 2 dim array of
# which will contains a list of
# chunkSize arrays that contian
# the data cells of that block

将 csv 文件的第一列(且仅在本例中)拆分为包含 chuckSized 数据单元格列表的列表的最佳方法是什么?

注意 1:如果 chunkSize 是 7 并且 csv 文件有 8 个单元格,那么最后一个单元格应该被忽略。注2:chunkSize大于csv文件中单元格的情况将被忽略。

示例

输入

block 大小 = 2

csv 文件 =

1
2
3
4
5
6

结果

print(columnChunks) 应该等同于

[ [1,2]
[3,4]
[5,6] ]

最佳答案

假设您的 block 大小将成为文档长度的一个因素,以下示例可能会解决您的问题。

import pandas
df = pandas.DataFrame([1,2,3,4,5,6,7,8]) #replace with the readcsv output
chunksize = 2
ll = len(df[0])
result = df.transpose().values.reshape(ll//chunksize,chunksize)
print(result)

关于python - 如何解析多个 n 大小的数组中的单个 csv 文件列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57227488/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com