gpt4 book ai didi

python - 如何将分组/分箱数据帧转换为 numpy 数组?

转载 作者:太空宇宙 更新时间:2023-11-03 18:20:47 24 4
gpt4 key购买 nike

我想知道如何将我的分箱数据帧转换为可以在 sklearn 的 PCA 中使用的分箱 numpy 数组。

这是到目前为止我的代码(x 是我原始的未合并数据框):

bins=(2,6,10,14,20,26,32,38,44,50,56,62,68,74,80,86,92,98)
binned_data = x.groupby(pd.cut(x.Weight, bins))

我想将 binned_data 转换为 numpy 数组。提前致谢。

编辑:

当我尝试 binned_data.values 时,我收到此错误:

AttributeError: Cannot access attribute 'values' of 'DataFrameGroupBy' objects, try using the 'apply' method

最佳答案

您需要对 GroupBy 对象应用某种聚合以返回 DataFrame。完成后,您可以使用 .values 提取 numpy 数组。

例如,如果您想要每个容器中数据的总和或计数,您可以执行以下操作:

binned_data.sum().values
binned_data.size().values

编辑:我的代码并不完全正确,因为列(权重)和索引将具有相同的名称。可以通过重命名索引来修复,如下:

binned_data = x.groupby(pd.cut(x.Weight, bins)).sum()
binned_data.index.name = 'Weight_Bin'
binned_data.reset_index().values

关于python - 如何将分组/分箱数据帧转换为 numpy 数组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24190917/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com