gpt4 book ai didi

python - 遍历文件夹中的文件

转载 作者:行者123 更新时间:2023-11-30 22:46:57 27 4
gpt4 key购买 nike

我正在使用 pandas 来读取和分析大型 NHS 处方数据集。它们单独保存为文件夹中的 csv 文件。我想将相同的几行代码分别应用于每个文件 - 因此我想用 pandas 单独读取每个数据帧,然后提取相关数据并执行基本计算。

这是我到目前为止的代码:

import pandas as pd
import glob

path = "/Volumes/TOSHIBA EXT/Datasets/2015"
all_files = glob.glob(path + "/*.CSV")

for f in all_files:
pd.read_csv(f,index_col=None, header=0, usecols=[2,4,5], names=['PRACTICE','BNF NAME', 'ITEMS'])
f=f[f['BNF NAME'].str.contains('Ampicillin' and 'Amoxicillin' and 'Co-Amoxiclav')]
print pd.to_numeric(f['ITEMS']).sum()

但是出现以下错误..

TypeError: string indices must be integers, not str 

我理想地希望定义一个函数,选择包含以下字符串的相关行:“Ampicillin”、“Amoxicillin”和“Co-Amoxiclav”;然后合计每个文件的项目数(即合计名为“ITEMS”的列),然后我可以在 for 循环中使用它来迭代每个文件。

非常感谢有关如何避免此错误并实现上述目标的任何指示。

非常感谢! :)

最佳答案

f 是文件名,但您将其用作 DataFrame - f['BNF NAME']

你需要

df = pd.read_csv(...)

然后你就可以使用

df['BNF NAME']

df = df[ df['BNF NAME'] ... ]

df['ITEMS']

关于python - 遍历文件夹中的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40695597/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com