gpt4 book ai didi

Python:如何获取数据框中多个数组的元素标准差

转载 作者:行者123 更新时间:2023-11-28 21:39:49 24 4
gpt4 key购买 nike

我有一个相当大的数据框 (df),每个单元格中包含数组和 NaN,前 3 行如下所示:

df:
A B C
X [4, 8, 1, 1, 9] NaN [8, 2, 8, 4, 9]
Y [4, 3, 4, 1, 5] [1, 2, 6, 2, 7] [7, 1, 1, 7, 8]
Z NaN [9, 3, 8, 7, 7] [2, 6, 3, 1, 9]

我已经知道(thanks to piRSquared)如何对每一列的行取元素平均,以便我得到:

element_wise_mean:
A [4.0, 5.5, 2.5, 1.0, 7.0]
B [5.0, 2.5, 7.0, 4.5, 7.0]
C [5.66666666667, 3.0, 4.0, 4.0, 8.66666666667]

现在我想知道如何获得各自的标准偏差,知道吗?另外,我还不明白 groupby() 是做什么的,谁能更详细地解释一下它的功能?


df

np.random.seed([3,14159])
df = pd.DataFrame(
np.random.randint(10, size=(3, 3, 5)).tolist(),
list('XYZ'), list('ABC')
).applymap(np.array)

df.loc['X', 'B'] = np.nan
df.loc['Z', 'A'] = np.nan

element_wise_mean

df2               = df.stack().groupby(level=1)
element_wise_mean = df2.apply(np.mean, axis=0)

element_wise_sd

element_wise_sd   = df2.apply(np.std, axis=0)
TypeError: setting an array element with a sequence.

最佳答案

使用 lambda 应用 np.std 并转换为 numpy array 对我有用:

element_wise_std = df2.apply(lambda x: np.std(np.array(x), 0))
#axis=0 is by default, so can be omit
#element_wise_std = df2.apply(lambda x: np.std(np.array(x)))
print (element_wise_std)
A [0.0, 2.5, 1.5, 0.0, 2.0]
B [4.0, 0.5, 1.0, 2.5, 0.0]
C [2.62466929134, 2.16024689947, 2.94392028878, ...
dtype: object

或来自 comment 的解决方案:

element_wise_std = df2.apply(lambda x: np.std(x.values, 0))
print (element_wise_std)
A [0.0, 2.5, 1.5, 0.0, 2.0]
B [4.0, 0.5, 1.0, 2.5, 0.0]
C [2.62466929134, 2.16024689947, 2.94392028878, ...
dtype: object

我试着解释更多:

首先由 stack reshape - 将列添加到 index 并创建 Multiindex

print (df.stack())
X A [4, 8, 1, 1, 9]
C [8, 2, 8, 4, 9]
Y A [4, 3, 4, 1, 5]
B [1, 2, 6, 2, 7]
C [7, 1, 1, 7, 8]
Z B [9, 3, 8, 7, 7]
C [2, 6, 3, 1, 9]
dtype: object

然后groupby(level=1)表示按Multiindex的第一层分组-(按值A, BC) 和 apply一些功能。这是 np.std

Pandas 不能很好地处理array 或列表,所以转换是必要的。 (看起来像bug)

关于Python:如何获取数据框中多个数组的元素标准差,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46278161/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com