gpt4 book ai didi

arrays - Pandas (python) 中 DataFrame 中的 Pairwise Cohen 的 Kappa 行

转载 作者:行者123 更新时间:2023-12-04 07:23:24 27 4
gpt4 key购买 nike

我非常感谢这方面的一些帮助。我正在使用 jupyter 笔记本。
我有一个数据框,我想在其中计算内部可靠性。我想通过 ID 列的值对它们进行成对比较(所有 ID 的频率为 2,每个编码器一个)。所有的 ID 值代表不同的文章,所以我不想将它们放在一起比较,而是更多地取每对(也可能是每列)的平均可信度。

N.  ID.     A.  B.      
0 8818313 Yes Yes 1.0 1.0 1.0 1.0 1.0 1.0
1 8818313 Yes No 0.0 1.0 0.0 0.0 1.0 1.0
2 8820105 No Yes 0.0 1.0 1.0 1.0 1.0 1.0
3 8820106 No No 0.0 0.0 0.0 1.0 0.0 0.0
我已经能够找到 cohen's k 的一些说明,但没有找到如何在 ID 列中按值成对执行此操作。
有谁知道如何解决这个问题?

最佳答案

这是我将如何处理它:

from io import StringIO
from sklearn.metrics import cohen_kappa_score

df = pd.read_csv(StringIO("""
N,ID,A,B,Nums
0, 8818313, Yes, Yes,1.0 1.0 1.0 1.0 1.0 1.0
1, 8818313, Yes, No,0.0 1.0 0.0 0.0 1.0 1.0
2, 8820105, No, Yes,0.0 1.0 1.0 1.0 1.0 1.0
3, 8820105, No, No,0.0 0.0 0.0 1.0 0.0 0.0 """))


def kappa(df):
nums1 = [float(num) for num in df.Nums.iloc[0].split(' ') if num]
nums2 = [float(num) for num in df.Nums.iloc[1].split(' ') if num]
return cohen_kappa_score(nums1, nums2)

df.groupby('ID').apply(kappa)
这将生成:
ID
8818313 0.000000
8820105 0.076923
dtype: float64

关于arrays - Pandas (python) 中 DataFrame 中的 Pairwise Cohen 的 Kappa 行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68359385/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com