gpt4 book ai didi

python - 如何在整个 DataFrame 上执行相当于 pd.Series.str.count() 的操作?

转载 作者:行者123 更新时间:2023-12-01 08:18:43 25 4
gpt4 key购买 nike

目标:计算原告和被告的数量,但不计算反被告或反原告的数量。不计算 NaN。

假设大约 200 行和最多 100 列,其名称与以下示例类似。

数据:

    cl_parties_1_name   cl_parties_1_party_types_0_name   cl_parties_1_party_types_10_name  cl_parties_1_party_types_12_name    cl_parties_1_party_types_1_name   cl_parties_1_party_types_2_name
0 Jason Boyd NaN Counter Defendant NaN Plaintiff NaN
1 Roberto Santana Plaintiff NaN NaN NaN Counter Defendant
2 Raymond Satterfield Counter Defendant NaN NaN Plaintiff NaN

期望的输出:

Plaintiffs = 3
Defendants = 0

背景故事:我有一堆嵌套的 JSON,它是从 API 分页交付的。我已取消嵌套并将页面附加在一起。

这给我留下了 100 行和可能的几十列。

编辑:我知道这个问题已经被问过好几次关于系列的问题了,但我找不到整个数据框的答案,也找不到如何以半有效的方式在所有列上执行此操作。我需要查看这些 ~100x~200 DataFrame 中的大约 10,000 个。

最佳答案

您可以检查每个单元格中的确切字符串以及轴 0 和 1 上的总和。

df.eq('Plaintiff').sum().sum()

使用 Numpy sum 会更高效,

np.sum(df.eq('Plaintiff').values)

3

np.sum(df.eq('Defendants').values)

3

关于python - 如何在整个 DataFrame 上执行相当于 pd.Series.str.count() 的操作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54816688/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com