gpt4 book ai didi

python - 比较数据框的所有数字列

转载 作者:行者123 更新时间:2023-11-28 22:26:04 26 4
gpt4 key购买 nike

我有以下 csv 文件:

C1,C2,C3,C4,C5,C6,C7
0,1,1,1,1,1,1
1,1,1,1,1,1,1
0,1,1,1,0,0,1
0,1,0,1,0,0,1
0,1,1,1,1,1,1
1,1,1,1,1,1,1

我想创建一个比较列对的数据框。我想计算每对列共享值 1 的次数。因此,对于问题开头显示的数据,我想生成以下数据框:

   C1 C2 C3 C4 C5 C6 C7
C1
C2
C3
C4
C5
C6
C7

[C1,C1] 将包含 C1 等于 1 的次数:

awk -F',' '$1==1' f.csv | wc -l

[C1,C2] 将包含 C1 等于 C2 且等于 1 的次数。

awk -F',' '$1==1 && $1==$2' f.csv | wc -l

有没有更简单的方法来计算这个?也许使用 pandas

最佳答案

如果数据框只包含1和0,可以使用矩阵乘法dot :

df = pd.read_csv("/path/to/csvfile")

df.T.dot(df)

enter image description here

关于python - 比较数据框的所有数字列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45109115/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com