我有多个像这样的顺序数据框:
df1 = pd.DataFrame( [['tom', 10], ['nick', 15], ['juli', 14]] , columns = ['Name', 'Age'])
df2 = pd.DataFrame([['tom', 10], ['nick', 15], ['juli', 14]] , columns = ['Name', 'Age'])
df3 = pd.DataFrame([['tom', 10], ['nick', 15], ['juli', 14]] , columns = ['Name', 'Age'])
df4 = pd.DataFrame([['tom', 10], ['nick', 15], ['juli', 14]] , columns = ['Name', 'Age'])
我需要创建一个 for 循环来 append 它们并获得一个新的数据框。我尝试了下面的代码,但它不起作用,因为 python 将 df1 识别为字符串。
tempdf = df1
for i in range(2,4):
tempdf = tempdf.append(("df"+str(i)))
print(tempdf)
如何让 python 将它们识别为我创建的数据框对象?
首先,我要强调的是,必须这样做表明源数据帧的生成方式存在问题,您应该考虑修复该问题。
使用 Python,几乎可以做任何您想做的事情。使用这种权力是否可取完全是另一个问题。
在这种情况下,最安全的方法可能是使用 globals()
:
n_dataframes = 4
g = globals()
dataframes = [g[f'df{i}'] for i in range(1, n_dataframes + 1)]
result_df = pd.concat(dataframes)
print(result_df)
输出:
Name Age
0 tom 10
1 nick 15
2 juli 14
0 tom 10
1 nick 15
2 juli 14
0 tom 10
1 nick 15
2 juli 14
0 tom 10
1 nick 15
2 juli 14
您可以对结果进行进一步的处理,例如调用reset_index
。
另一种选择是使用 eval
,它坚定地转向“你不应该这样做,除非你真的知道你在做什么”的领域,因为它允许执行任意代码:
dataframes = [eval(f'df{i}') for i in range(1, n_dataframes + 1)]
请注意,上面的代码使用了 f-strings,这是仅在 Python 3.6 中引入的语法。因此,如果您的 Python 版本低于该版本,请将 f'df{i}'
替换为 'df{}'.format(i)
。
我是一名优秀的程序员,十分优秀!