gpt4 book ai didi

python - 如何使用正则表达式中的变量来计算平均值

转载 作者:行者123 更新时间:2023-12-01 23:01:41 25 4
gpt4 key购买 nike

假设我有一个如下所示的 CSV 文件:

2000,1
2001,2
2000,4
2001,8

我希望 python 能够找到包含 2000 的行,检查第二列的值,然后对 2000 的值进行平均。我也希望对 2001 年执行此操作。

有什么方法可以使用正则表达式吗?我在这里提出了一个非常简单的版本;真实数据有数千行。

最佳答案

假设元组之间有换行符,我建议使用pandas

如果情况并非如此,请参阅@Tim Biegeleisen 的回答

import pandas as pd

#create some example date to illustrate the logic
df = pd.DataFrame({"variable":[2000,2001,2000,2001], "value":[1,2,4,8]})

df.groupby("variable")["value"].mean()

输出:

variable
2000 2.5
2001 5.0
Name: value, dtype: float64

在您的情况下,您应该提取 CSV 文件,例如:

df = pd.read_csv("myfile.csv", sep=",")

请参阅 read_csv 文档,以确保正确读取您的数据。

关于python - 如何使用正则表达式中的变量来计算平均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59196757/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com