gpt4 book ai didi

python - 路口2 Pandas 数据框

转载 作者:太空宇宙 更新时间:2023-11-03 15:52:36 25 4
gpt4 key购买 nike

在我的问题中,我有 2 个数据帧 mydataframe1mydataframe2,如下所示。

mydataframe1
Out[13]:
Start End Remove
50 60 1
61 105 0
106 150 1
151 160 0
161 180 1
181 200 0
201 400 1


mydataframe2
Out[14]:
Start End
55 100
105 140
151 154
155 185
220 240

mydataframe2 我想删除在 "Remove"=1 中的任何间隔中包含(也部分包含)间隔 Start-End 的行我的数据框 1。换句话说,mydataframe2 的区间和 mydataframe1

的区间之间不应该有任何交集

在这种情况下 mydataframe2 变为

mydataframe2
Out[15]:
Start End
151 154

最佳答案

您可以使用 pd.IntervalIndex 进行交叉

获取要删除的行

In [313]: dfr = df1.query('Remove == 1')

从要删除的范围构造 IntervalIndex

In [314]: s1 = pd.IntervalIndex.from_arrays(dfr.Start, dfr.End, 'both')

从待测构造IntervalIndex

In [315]: s2 = pd.IntervalIndex.from_arrays(df2.Start, df2.End, 'both')

选择不在 s1 范围内的 s2 行

In [316]: df2.loc[[x not in s1 for x in s2]]
Out[316]:
Start End
2 151 154

详细信息

In [320]: df1
Out[320]:
Start End Remove
0 50 60 1
1 61 105 0
2 106 150 1
3 151 160 0
4 161 180 1
5 181 200 0
6 201 400 1

In [321]: df2
Out[321]:
Start End
0 55 100
1 105 140
2 151 154
3 155 185
4 220 240

In [322]: dfr
Out[322]:
Start End Remove
0 50 60 1
2 106 150 1
4 161 180 1
6 201 400 1

IntervalIndex 详细信息

In [323]: s1
Out[323]:
IntervalIndex([[50, 60], [106, 150], [161, 180], [201, 400]]
closed='both',
dtype='interval[int64]')

In [324]: s2
Out[324]:
IntervalIndex([[55, 100], [105, 140], [151, 154], [155, 185], [220, 240]]
closed='both',
dtype='interval[int64]')

In [326]: [x not in s1 for x in s2]
Out[326]: [False, False, True, False, False]

关于python - 路口2 Pandas 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45693330/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com