gpt4 book ai didi

python - 模式识别和子集化

转载 作者:太空宇宙 更新时间:2023-11-03 14:00:52 24 4
gpt4 key购买 nike

我有一个包含 3 列的数据框。如果列值再次达到 1,我想对数据帧进行子集化,并将其标记为 1 个观察值,并继续直到文件末尾。

数据框:

colA   colB  colC    
a12 3 1
c45 4 0
d36 4 0
e97 5 0
h65 3 1
k67 3 1
l54 5 0

所以我应该能够将 3 个观察结果子集为 [a12,c45,d36.e97],[h65],[k67,l54] 并将其传递到另一个仅包含列的数据框命名并将此处出现的值标记为 1,其余为 0,以将其传递给 ML 算法。

我尝试拉出模式但收到错误:

The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all()

最佳答案

您可以将 cumsum 与 colC 一起使用,然后将该结果用作组 key

df.colC.cumsum()
Out[282]:
0 1
1 1
2 1
3 1
4 2
5 3
6 3
Name: colC, dtype: int64
df.groupby(df.colC.cumsum()).colA.apply(list)
Out[284]:
colC
1 [a12, c45, d36, e97]
2 [h65]
3 [k67, l54]
Name: colA, dtype: object

关于python - 模式识别和子集化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49247174/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com