gpt4 book ai didi

python - for-loop 根据 pandas 数据帧定义生成 'cannot insert {}, already exists' 错误

转载 作者:行者123 更新时间:2023-12-01 07:18:25 24 4
gpt4 key购买 nike

我有一系列的天文观测,它们被放入程序生成的每个观测年份的DataFrame中(即df2015、df2016等),这些DataFrame需要在后续过程中进行修改,我将它们全部放在列表。用于定义列表的方法会有所不同。明确定义的列表

dfs = [df2015, df2016, df2017, df2018, df2019]

允许进一步修改df,但它不符合代码的目的——无论多少年,自动处理标准数据集。程序生成的列表

for yr in years:
exec('dfs = [df' + yr + ' for yr in years]')

似乎大部分时间都在工作,如下所示:

for df in dfs:
dfX = df.dtypes
for index, val2 in dfX.items():
if val2 == 'float64':
df.iloc[:,index] = df.iloc[:,index].fillna(0).astype('int64')

,但在某些情况下会失败,例如:

for df in dfs:
i=1
for i in range(1, 13):
ncol = i + (i-1) *2
if i < 10:
nmon = '0' + str(i)
else:
nmon = '' + str(i)
df.insert(ncol, 'M' + nmon, nmon)
i += 1

当带有 insert 语句的 for 循环产生错误时:

ValueError: cannot insert M01, already exists

我尝试过列表理解而不是 for 循环,尝试更改循环嵌套顺序(以防万一)等。

上述引用步骤的目的是转换:


0 1 2 3 4 5 6 7 8 9 ... 15 16 17 18 19 20 21 22 23 24
0 1 713 1623 658.0 1659.0 619 1735 526.0 1810.0 439 ... 437 1903 510.0 1818.0 542 1725 618.0 1637.0 654 1613
1 2 714 1624 657.0 1700.0 618 1736 525.0 1812.0 438 ... 438 1902 511.0 1816.0 543 1724 619.0 1636.0 655 1613
2 3 714 1625 655.0 1702.0 616 1737 523.0 1813.0 437 ... 439 1901 512.0 1814.0 544 1722 620.0 1635.0 656 1612
3 4 714 1626 654.0 1703.0 614 1738 521.0 1814.0 435 ... 440 1900 513.0 1813.0 545 1720 622.0 1634.0 657 1612
4 5 713 1627 653.0 1704.0 613 1739 520.0 1815.0 434 ... 441 1859 514.0 1811.0 546 1719 623.0 1633.0 658 1612

进入此


0 M01 D01 1 2 M02 D02 3 4 M03 ... 19 20 M11 D11 21 22 M12 D12 23 24
0 1 01 1 713 1623 02 1 658 1659 03 ... 542 1725 11 1 618 1637 12 1 654 1613
1 2 01 2 714 1624 02 2 657 1700 03 ... 543 1724 11 2 619 1636 12 2 655 1613
2 3 01 3 714 1625 02 3 655 1702 03 ... 544 1722 11 3 620 1635 12 3 656 1612
3 4 01 4 714 1626 02 4 654 1703 03 ... 545 1720 11 4 622 1634 12 4 657 1612
4 5 01 5 713 1627 02 5 653 1704 03 ... 546 1719 11 5 623 1633 12 5 658 1612

最佳答案

您创建去年数据帧的副本列表。如果您的年份列表是例如['2015', '2016', '2017', '2018'],然后生成一个 dfs 作为 [df2018, df2018, df2018, df2018] ,这将导致到错误。

这将为您带来正确的结果:

dfs = [eval('df' + yr) for yr in years]

它形成所需的数据帧名称并对其进行评估,以便您获得数据帧列表。

关于python - for-loop 根据 pandas 数据帧定义生成 'cannot insert {}, already exists' 错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57836855/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com