gpt4 book ai didi

python - 选择 pandas DataFrame 中的列

转载 作者:太空宇宙 更新时间:2023-11-04 06:01:35 24 4
gpt4 key购买 nike

我有一个包含数百列抗生素名称的 Pandas 数据框。每种特定的抗生素在数据框中编码为以 E、T 或 P 结尾,以指示经验、治疗或预防方案。

列列表的示例摘录是:

['MeropenemP', 'MeropenemE', 'MeropenemT', DoripenemP', 'DoripenemE', 'DoripenemT', ImipenemP', 'ImipenemE', 'ImipenemT', 'BiapenemP', 'BiapenemE', 'BiapenemT', 'PanipenemP', 'PanipenemE', 'PanipenemT','PipTazP', 'PipTazE', 'PipTazT','PiperacillinP', 'PiperacillinE', 'PiperacillinT']

一小部分数据样本位于此处:

Sample antibiotic data

对于我来说,使用正则表达式将任何类型的列分离到单独的数据帧中非常简单,例如选择我使用的所有经验性处方抗生素色谱柱:

E_cols = master.filter(axis=1, regex=('[a-z]+E$'))

每列都有一个二进制值 (0,1),表示每个人(行)的每种抗生素方案类型的处方。

问题:我将如何对每种类型的方案类型的所有列(1)的求和,并为数据框中的每个结果生成一个新列,例如total_emperical, total_prophylactic, total_treatment.

我想添加到现有数据框的原因是我希望过滤每个方案类型的其他值。

最佳答案

一旦您生成了与您的 reg exp 匹配的列列表,您就可以像这样创建新的总计列:

df['total_emperical'] = df[E_cols].sum(axis=1)

并重复其他总计。

axis=1 传递给 sum将按行求和

关于python - 选择 pandas DataFrame 中的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24650612/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com