gpt4 book ai didi

python - Pandas 将具有相同名称但不同后缀的列转换为索引并将索引转换为列

转载 作者:行者123 更新时间:2023-12-02 18:19:04 24 4
gpt4 key购买 nike

我有一个问题,我试图改变数据的形状,但试图在行级别上使用列名而不附加后缀。

例如

我原来的df是这样的

+------+--------+--------+--------+--------+--------+--------+
| Year | col1_a | col2_a | col3_a | col1_b | col2_b | col3_b |
+------+--------+--------+--------+--------+--------+--------+
| 2017 | 1.4 | 555 | 5 | 123 | 55.5 | 80 |
| 2018 | 1.5 | 444 | 6 | 456 | 56.5 | 90 |
| 2019 | 0.6 | 333 | 8 | 789 | 57.5 | 100 |
+------+--------+--------+--------+--------+--------+--------+

我正在尝试将其 reshape 为

+------+------+------+------+------+------+------+
| | a | a | a | b | b | b |
+------+------+------+------+------+------+------+
| 2017 | 2018 | 2019 | 2017 | 2018 | 2019 |
| col1 | 1.4 | 1.5 | 0.6 | 123 | 456 | 789 |
| col2 | 555 | 444 | 333 | 55.5 | 56.5 | 57.5 |
| col3 | 5 | 6 | 8 | 80 | 90 | 100 |
+------+------+------+------+------+------+------+

我可以使用 pivot_table 但问题是我无法在索引级别获得唯一的列名。知道可以使用哪种方法 reshape 它吗?

最佳答案

我们可以 set_index 来处理任何没有设置 prefix_suffix 模式的列。然后,我们可以使用带有 expand=Truen=1str.rsplit 来创建多索引列。 rsplitn=1 确保我们只在最右边的下划线处拆分一次。然后 stack 将新的列索引级别转换为行索引级别,然后 transpose 获得正确的一般形状:

df = df.set_index('Year')
df.columns = df.columns.str.rsplit('_', expand=True, n=1)
df = df.stack(level=1).transpose()
Year   2017          2018          2019       
a b a b a b
col1 1.4 123.0 1.5 456.0 0.6 789.0
col2 555.0 55.5 444.0 56.5 333.0 57.5
col3 5.0 80.0 6.0 90.0 8.0 100.0

我们可以使用 swaplevelsort_index 进一步清理数据,使 header 与预期顺序相匹配。也 rename_axis 删除任何不需要的列名:

df = df.set_index('Year')
df.columns = df.columns.str.rsplit('_', expand=True, n=1)
df = (
df.stack(level=1)
.transpose()
.sort_index(axis=1, level=1)
.swaplevel(axis=1)
.rename_axis(columns=[None, None])
)
          a                    b              
2017 2018 2019 2017 2018 2019
col1 1.4 1.5 0.6 123.0 456.0 789.0
col2 555.0 444.0 333.0 55.5 56.5 57.5
col3 5.0 6.0 8.0 80.0 90.0 100.0

使用的设置:

import pandas as pd

df = pd.DataFrame({
'Year': [2017, 2018, 2019], 'col1_a': [1.4, 1.5, 0.6],
'col2_a': [555, 444, 333], 'col3_a': [5, 6, 8], 'col1_b': [123, 456, 789],
'col2_b': [55.5, 56.5, 57.5], 'col3_b': [80, 90, 100]
})

关于python - Pandas 将具有相同名称但不同后缀的列转换为索引并将索引转换为列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71106312/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com