gpt4 book ai didi

python - 将组迭代到数据框中

转载 作者:太空宇宙 更新时间:2023-11-04 02:31:55 26 4
gpt4 key购买 nike

                 A   B
0 2002-01-16 0
1 2002-01-16 4
2 2002-01-16 -2
3 2002-01-16 11
4 2002-01-16 12
5 2002-01-17 0
6 2002-01-17 -18
7 2002-01-17 16
8 2002-01-18 0
9 2002-01-18 -1
10 2002-01-18 4

results = {}
grouped = df.groupby("A")

for name, group in grouped:
if (df["B"] >= 10).any():
results[name] = df.loc[df["B"] >= 10].head(1)
print(results[name])
elif (df["B"] <= -10).any():
results[name] = df.loc[df["B"] <= -10].head(1)
print(results[name])
else:
results[name] = df.loc[df["B"] > -10, :].tail(1)
print(results[name])

输出:

            A   B
3 2002-01-16 11
A B
3 2002-01-16 11
A B
3 2002-01-16 11

我想迭代并获得每个 A 组 的一个结果,具有以下条件:

  • 如果任何B 列 的值 >= 10 或 <= -10,则仅将第一个添加到“结果”并跳到下一组以继续迭代。
  • 如果没有任何 B 列值 >= 10 或 <= -10,将最后一个值添加到“结果”并跳到下一组继续迭代。

期望的输出是:

            A   B
3 2002-01-16 11
A B
6 2002-01-17 -18
A B
10 2002-01-18 4

最佳答案

您的代码包含两个阻止正确输出的错误。首先,也是最明显的,是你没有使用你的 groupfor环形。相反,您对完整的 df 进行操作框架。这就是为什么每次输入都得到相同结果的原因。

修复后,您将几乎得到预期的结果。但是,由于您的第二个错误,不完全是。根据你的描述,你想等于>= 10<= -10 .但是,您的代码首先执行大于检查,如果该检查成功,它将生成您的输出。因此,组的结果 2002-01-17将是 16,而不是 -18。

第二个问题的修复是确保您在同一个 if 中测试这两个条件。子句,通常使用 or .但是,在您当前的情况下,可以使用绝对值(abs() 运算符)将这两个测试合并为一个。不过,这有点特殊(尽管很常见)。使用 or 可以很好地理解这种方式和更一般的方式。 .

这会将案例数量减少到两个,删除 elif线。此外,可以做一些小的修改来增加可读性。综合起来会给你留下类似于:

results = {}
grouped = df.groupby("A")

for name, group in grouped:
if (abs(group["B"]) >= 10).any():
results[name] = group[abs(group["B"]) >= 10].head(1)
else:
results[name] = group.tail(1)
print(results[name])

生成所需的输出:

           A   B
3 2002-01-16 11
A B
6 2002-01-17 -18
A B
10 2002-01-18 4

关于python - 将组迭代到数据框中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48972492/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com