gpt4 book ai didi

python - 数据框未正确附加

转载 作者:太空宇宙 更新时间:2023-11-03 20:39:08 25 4
gpt4 key购买 nike

我有一个这种格式的文件字典:

{'filea': ['test/folder2/filea', 'test/folder3/filea', 'test/folder1/filea'],
'fileb': ['test/folder2/fileb', 'test/folder3/fileb', 'test/folder1/fileb'],
'filec': ['test/folder2/filec', 'test/folder3/filec', 'test/folder1/filec']}

我创建了一个 for 循环来遍历每个文件名并创建一个数据帧,该数据帧组合了上面字典中每个键对应的文件,但是当我运行循环时,在这种情况下下一个 fileb 将被附加到数据帧中为文件 a 创建。我不知道如何解决这个问题,因为我花了几个小时没有解决这个问题,可能也是因为我之间有很长的代码来理解我的缩进错误在哪里。我的代码如下:

假设上面的字典名为 file_list

for key,files in file_list.items():
#dataset = pd.Dataframe()
for i in files: #loop over the files in each key
#do something....

df = pd.DataFrame({'A':B,'C':D,'E':F})
print('This dataframe has the shape:',df.shape)

#save dataframe
df.to_hdf('xxx.hdf'.format(key[0:-4]),mode='w', key='df')

我仍然无法真正看出我的错误在哪里,因为当循环对 fileb 中的文件进行处理时,它被附加到包含 filea 中的数据的数据帧中,而不是为 fileb 创建一个全新的数据帧。非常感谢对此的任何帮助!

最佳答案

when I run my loop, the next fileb in this case is getting appended into the dataframe created for file a.

大概您在外部 for 循环之前仅初始化 BDF 一次,所以在第一个周期之后的每个周期中,当前周期的数据将附加到前一个周期的数据中。要解决此问题,请在外部 for 循环内重置 BDF

关于python - 数据框未正确附加,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56967689/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com