gpt4 book ai didi

python - 在 Python 中根据 CSV 的标准映射出现次数

转载 作者:太空宇宙 更新时间:2023-11-03 21:17:04 31 4
gpt4 key购买 nike

我有一个包含许多列的 CSV,我只关心两列,它们是“文本字段(受影响的环境)”和“文本字段(评级)”。

环境列包含 dev、test、prod 等条目。评级列包含 P1、P2、P3、P4、P5 等条目。

我需要以某种方式找出每个环境发生的次数。在 Python 中执行此操作的最佳方法是什么?

最终目标是这样的:P1/P2 测试:15测试总数:30P1/P2 舞台:24测试总数:30

P1/P2 将是这些的合计,Total 将是其他人的合计,即 P3、P4、P5

最佳答案

您已使用 pandas 标记了您的问题,因此我假设您的数据已经采用 DataFrame 的形式。如果是这样,则应执行以下命令:

df.groupby(['env', (df['rating'].isin(['P1', 'P2']))]).size().rename(index={True: 'P1/P2', False: 'Total'}, level=1)

(这假设您的 DataFrame 名为 df 并且您的“受影响的环境”和“评级”列名为 env评级。)

这会对 env 列的第一个唯一值进行分组,然后对 rating 列进行分组,具体取决于其中包含的值是“P1”还是“P1” 'P2',或者不是。然后计算每个子组内的行数。

如果您的数据尚未采用 DataFrame 的形式,则需要将其从 CSV 中加载,这可以通过以下命令完成:

df = pd.read_csv(file_path)

您可能需要稍微调整参数,具体取决于文件的格式;该文档可以找到here .

关于python - 在 Python 中根据 CSV 的标准映射出现次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54611708/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com