gpt4 book ai didi

python - pandas 中的 block 子集

转载 作者:行者123 更新时间:2023-12-01 02:37:27 26 4
gpt4 key购买 nike

这是我的代码:

path = 'C:\\Users\\Daniil\\Desktop\\dw_payments'
#list of all df:
all_files = glob.glob(path + '/*.csv')
all_payments_data = pd.DataFrame()
dfs = []
for file in all_files:
df = pd.read_csv(file,index_col = None,chunksize = 200000)
df_f = df[df['CUSTOMER_NO'] == 20069675]
df_f = pd.concat(df_f,ignore_index = True)
dfs.append(df_f)

all_payments_data = pd.concat(dfs)

正如您在 df_f = df[df['CUSTOMER_NO'] == 20069675] 行中看到的,我想在一个 block 中选择特定客户,然后将其合并到空数据框中。我想多次重复这个过程(有很多文件)。

但它引发了我一个错误:

TypeError: 'TextFileReader' object is not subscriptable 

如何修复它?

最佳答案

我认为你需要通过 TextFileReader 进行迭代,过滤并附加到df_s。最后一次concat

注意 - 所有文件的结构必须相同(相同的列名称以相同的顺序)

df_s = []
for file in all_files:
txt = pd.read_csv(file,index_col = None,chunksize = 200000)
for df in txt:
df_s.append(df[df['CUSTOMER_NO'] == 20069675])

df_f = pd.concat(df_s,ignore_index = True)

关于python - pandas 中的 block 子集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46070129/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com