gpt4 book ai didi

python - 如果位置存在于范围内,则按行索引填充每列​​的数据框值

转载 作者:行者123 更新时间:2023-12-04 07:20:25 26 4
gpt4 key购买 nike

我有一个范围的开始和停止坐标列表,并希望根据它们在范围中的存在来填充 Pandas df。
行数是预先确定的,并用“0”填充。例如,如果列的范围是 1,3,则行(索引)1-3 将填充为“1”。

d={
'a': [[0,2], [3,7], [13,23], [24,25]],
'b': [[1,5], [8,12], [15,18], [20,24]],
}
presabsdict = {}

for G in d.keys():
refpositions = list('0'*50)
positions = d.get(G)
for pos in positions:
pos2 = pos[1]
pos1 = pos[0]
poslength = (pos2-pos1)
refpositions[pos1:(pos2+1)] = (list('1'*(poslength+1)))
presabsdict[G] = refpositions

df = pd.DataFrame.from_dict(presabsdict,orient='index').transpose()
df["Sitespresent"] = df.astype(int).sum(axis=1).astype(int)
print(df)
对于大型数据集,这非常低效。最终目标是 'Sitespresent'列因此放弃数据框的解决方案也适用

最佳答案

还有一种替代方法:

import pandas as pd
import numpy as np

def range_array(ranges, lenth):
grid = np.zeros( length, dtype=np.uint8)
for rng in ranges:
grid[ rng[0]:rng[1]] = 1
return(grid)

def make_df(ranges_list, length):
df_dict = {}
for i,ranges in enumerate(ranges_list):
df_dict[i] = range_array(ranges, length)
return(pd.DataFrame.from_dict(df_dict))
a = [[0,2], [0,7], [0,23], [0,25]]
b = [[1,5], [8,12], [15,18], [20,34]]
c = [[1,2], [9,12], [5,11], [20,14]]
d = [[4,6], [5,12], [15,21], [20,44]]
e = [[2,5], [3,12], [15,19], [20,54]]

ranges_list = [a,b,c,d,e]
length = 50
df = make_df(ranges_list, length)
df["sum"] = df.sum(axis=1)

print(df)
其中长度只需要超过范围内的最高单坐标。

关于python - 如果位置存在于范围内,则按行索引填充每列​​的数据框值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68546670/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com