我有一个 pandas
数据框,看起来像
In [97]: df
Out[97]:
A1 A1_step A1_step_n LB7 dF
0 40000 500 2 4 2
1 60000 300 3 6 7
我想使用具有 step
和 step_n
关键字的列以指定的步长“逐步”(迭代)数据帧的行。因此,在上面的示例数据框中,我想遍历 A1
列的 40000 行两次,步长为 500,步长为 300,步长为 60000。最后,我想数据框看起来像
In [98]: df2
Out[98]:
A1 LB7 dF
0 40000 4 2
1 40500 4 2
2 60000 6 7
3 60300 6 7
4 60600 6 7
其中 LB7
和 dF
的值被执行,不再需要“step”列。
我尝试遍历列试图找出哪些列被迭代并循环遍历这些循环以添加到数据框,但它很快变得非常困惑,我希望这里有人可以引导我更好的路径。
您可以像这样遍历行并手动构建数据框:
dfs = []
col_step = df.columns.str.extract('(.*\_step$)', expand=False).dropna()[0]
col_step_n = df.columns.str.extract('(.*\_step\_n$)', expand=False).dropna()[0]
for i, row in df.iterrows():
start = row['A1']
steps = row[col_step_n]
size = row[col_step]
stop = start + size * (steps)
df_cur = pd.DataFrame({'A1': np.arange(start, stop, size), 'LB7':row['LB7'], 'dF':row['dF']})
dfs.append(df_cur)
df_final = pd.concat(dfs, ignore_index=True)
输出
print(df_final)
A1 LB7 dF
0 40000 4 2
1 40500 4 2
2 60000 6 7
3 60300 6 7
4 60600 6 7
我是一名优秀的程序员,十分优秀!