gpt4 book ai didi

python - 如何根据数据框和 numpy 中的协变量对观察结果进行分类?

转载 作者:行者123 更新时间:2023-11-28 18:14:48 29 4
gpt4 key购买 nike

我有一个包含 n 个观测值的数据集,假设有 2 个变量 X1 和 X2。我试图根据 (X1, X2) 值的一组条件对每个观察结果进行分类。例如,数据集看起来像

df:Index     X1    X21         0.2   0.82         0.6   0.23         0.2   0.14         0.9   0.3

组由

定义
  • 第 1 组:X1<0.5 & X2>=0.5
  • 第 2 组:X1>=0.5 & X2>=0.5
  • 第 3 组:X1<0.5 & X2<0.5
  • 第 4 组:X1>=0.5 & X2<0.5

我想生成以下数据框。

expected result:Index     X1    X2    Group1         0.2   0.8   12         0.6   0.2   43         0.2   0.1   34         0.9   0.3   4

此外,对于此类问题,使用 numpy 数组会更好/更快吗?

最佳答案

在回答你的最后一个问题时,我绝对认为 pandas 是一个很好的工具;它可以在 numpy 中完成,但 pandas 在处理数据帧时可以说更直观,并且对于大多数应用程序来说足够快。 pandasnumpy 也能很好地协同工作。例如,在您的情况下,您可以使用 numpy.select 构建您的 pandas 列:

import numpy as np
import pandas as pd
# Lay out your conditions
conditions = [((df.X1 < 0.5) & (df.X2>=0.5)),
((df.X1>=0.5) & (df.X2>=0.5)),
((df.X1<0.5) & (df.X2<0.5)),
((df.X1>=0.5) & (df.X2<0.5))]

# Name the resulting groups (in the same order as the conditions)
choicelist = [1,2,3,4]

df['group']= np.select(conditions, choicelist, default=-1)

# Above, I've the default to -1, but change as you see fit
# if none of your conditions are met, then it that row would be classified as -1

>>> df
Index X1 X2 group
0 1 0.2 0.8 1
1 2 0.6 0.2 4
2 3 0.2 0.1 3
3 4 0.9 0.3 4

关于python - 如何根据数据框和 numpy 中的协变量对观察结果进行分类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49061921/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com