gpt4 book ai didi

python - 子样本丰度数据框

转载 作者:太空宇宙 更新时间:2023-11-03 20:31:38 26 4
gpt4 key购买 nike

我有一个数据框,其中物种为列,站点为行。每个单元格中都有我在该地点看到的每个物种的数量。例如

    Fern1   Fern2   Flower1 Flower2
Site1 15 0 6 1
Site2 0 46 16 40
Site3 25 1 19 3

总计 = 172但我想从这个数据集中随机抽取 100 个个体:

    Fern1   Fern2   Flower1 Flower2
Site1 10 0 3 0
Site2 0 26 10 26
Site3 14 0 10 1

(这个例子不是随机的,但我想要的是随机的)

所以我开始做

df.stack()
df[df != 0]
Site1   Fern1   15
Flower1 6
Flower2 1
Site2 Fern2 46
Flower1 16
Flower2 40

这是我需要帮助的部分现在我想从 1:len(count) 开始分组例如


Site1 Fern1 1 1
2 1
3 1
4 1
... ...
16 1
Flower1 1 1

这样我就可以使用 python 示例。
我发现this但它并没有完全达到我想要的效果。任何帮助,将不胜感激。我尝试尽可能多地查看,因为这是一个非常常见的问题,但我有点着急,认为有人可能已经这样做了。

提前致谢。

pandas: create a column from 1 to length of each group

结果 = df.groupby(df.index).transform(lambda x: np.arange(1,len(x)+1))

上面只是在我的专栏中给出了一堆[1],以及原始索引。

最佳答案

尝试查看cumcount

yyy = df.groupby(t.index).cumcount()+1

关于python - 子样本丰度数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57469335/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com