python - reshape MultiIndex 以分离

转载作者：太空宇宙更新时间：2023-11-04 05:20:24

25

4

看了pandas和MultiIndex的文档，这里的很多帖子，我还是没有完全理解这个概念。有人可以帮我找到这一行代码吗？

我想根据 xls 文件中的数据创建箱线图。线索是显示两个箱线图，一个用于参数 = 33，另一个用于参数 = 77。所以我的数据集需要按参数拆分结果。由于我没有完全理解这个概念，任何以某种方式拆栈的尝试都失败了

# -*- coding: utf-8 -*-
import pandas
import numpy as np
wbName= "Test (1).xlsx"
wsName = "Sheet1"
sort_by=['Name','Parameter']
df = pandas.read_excel(open(wbName, "rb"), sheetname=wsName)
id_col=list()
for sb in sort_by:
    id_col.append(np.where(df.columns.values==sb)[0][0])
df = pandas.read_excel(open(wbName, "rb"), sheetname=wsName, index_col=id_col)
print(df)
#oneline magic needed
df.plot.box()

所以 print(df) 返回(如预期的那样)

Name Parameter        
sdf  33             99
     33             99
     33             99
     33            645
     33            345
     77            567
     77             45
     77            456
     77            456
     77            234
     77            576
     77             45
ere  33             99
     33             99
     33             99
     33            645
     33            345
     77            567
     77             45
     77            456
     77            456
     77            234
     77            576
     77             45

但我假设我只需要一行来转换成(数字不是上面的例子)

Result             
Parameter        33   77
Name         
sdf               99   567
                  99   45
                  99   456
                 645   456
                 345   456 
ere               99   546 
                  99  465
                  99  456 
                 645  46

最佳答案

问题是您的 pd.MultiIndex 不是唯一的。

假设你的系列是s

df = pd.DataFrame({n: g.reset_index(drop=True) for n, g in s.groupby(level=[0, 1])})
df.stack(0).reset_index(0, drop=True).sort_index()

设置

import pandas as pd
from io import StringIO

txt = """Name Parameter   Value    
sdf  33             99
sdf  33             99
sdf  33             99
sdf  33            645
sdf  33            345
sdf  77            567
sdf  77             45
sdf  77            456
sdf  77            456
sdf  77            234
sdf  77            576
sdf  77             45
ere  33             99
ere  33             99
ere  33             99
ere  33            645
ere  33            345
ere  77            567
ere  77             45
ere  77            456
ere  77            456
ere  77            234
ere  77            576
ere  77             45"""

s = pd.read_csv(StringIO(txt), delim_whitespace=True, index_col=[0, 1], squeeze=True)

关于python - reshape MultiIndex 以分离，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40564877/

25

4

0

文章推荐： jquery - CSS 菜单下拉定位

文章推荐： linux - 如何复制文件/目录而不更改其属性

文章推荐： c++ - 调用 TerminateThread 时线程实际上何时终止？

python - 如何使用 MultiIndex 的相关级别对 MultiIndex DataFrame 进行切片
我有一个包含 4 个级别的 MultiIndex 的 pandas 数据框。我正在尝试为每个 1 级索引选择具有不同 4 级索引的行。例子: In [68]: df = pd.DataFrame({
python - Pandas multiindex dataframe - 从 multiindex 中的一个索引中选择最大值
我有一个数据框，其中包含 Year 和 Month 的多个索引，如下所示 | |Value Year |Month| | 1 | 3 1992 | 2 | 5
python - 如何用另一个的 MultiIndex 对一个 MultiIndex DataFrame 进行切片
我有一个带有 3 级 MultiIndex 的 pandas 数据框。我正在尝试根据对应于两个级别的值列表提取此数据帧的行。我有这样的事情: ix = pd.MultiIndex.from_prod
python - 将具有 multiindex 的 Pandas 数据框除以另一个具有较小 multiindex 的数据框
我想将具有多索引的数据帧中的所有列除以另一个具有多索引的数据帧，更小一级。前两个水平的蛾指数是相同的。并且应该播放第三级。 df_0 = pd.DataFrame( { "col0": [ 1
python - 如何将 Pandas Dataframe MultiIndex 行旋转到 MultiIndex 列中？
我想知道是否有人可以帮助我解决这个问题。如果我有一个简单的数据框: one two three four 0 A 1 a 1 1 A 2 b
python - 如何使用 MultiIndex 索引和 MultiIndex 列对 Pandas DataFrame 进行切片？
我希望创建一个新的 DataFrame，与基于芯片的设备 A 和 B 的结果相对应。以下是我创建 DataFrame 的代码: import numpy as np import pandas as
python - 如何使用 MultiIndex 索引和 MultiIndex 列对 Pandas DataFrame 进行切片？
我希望创建一个新的 DataFrame，与基于芯片的设备 A 和 B 的结果相对应。以下是我创建 DataFrame 的代码: import numpy as np import pandas as
python - pandas:将两个 DataFrame 与排序的 MultiIndex 连接起来，使得结果具有排序的 MultiIndex
请让我知道如何将两个 DataFrame 与排序的 MultiIndexes 连接起来，以便结果具有排序的 MultiIndex。由于两者都是排序的，算法必须根据两个 DataFrame 中的总行数
python - 使用包含新标签的数据附加带有 MultiIndex 的 pandas DataFrame，但保留旧 MultiIndex 的整数位置
基本场景对于推荐服务，我正在针对一组用户-项目交互训练矩阵分解模型 (LightFM)。为了使矩阵分解模型产生最佳结果，我需要将我的用户 ID 和商品 ID 映射到从 0 开始的连续整数 ID 范围
python - 带有 pandas groupby multiindex 的箱线图，用于来自 multiindex 的指定子级别
好的，所以我有一个数据框，其中包含时间序列数据，每列都有一个多行索引。这是数据的样例，它是 csv 格式的。加载数据在这里不是问题。我想要做的是能够创建一个箱线图，其中包含根据多索引特定行中的不同类
python - 使用级别中的唯一值重新索引 MultiIndex
我有这个数据框: df = pd.DataFrame({'NUMBER_1': {('2019-07', 'A'): 4, ('2019-07', 'D'): 2, ('2019-08', 'A'):
pandas Multiindex，仅对一个级别的值进行排序
我有点难以对用于我的一个数据集的列的 pandas MultiIndex 进行排序: MultiIndex(levels=[['Jan', 'Feb', 'Mar', 'Apr', 'May', 'J
pandas Multiindex，仅对一个级别的值进行排序
我有点难以对用于我的一个数据集的列的 pandas MultiIndex 进行排序: MultiIndex(levels=[['Jan', 'Feb', 'Mar', 'Apr', 'May', 'J
python - MultiIndex 来自不规则长度的列表
我有一个列表列表，我想将其制成多索引 Pandas 数据框，然后可以合并到原始 Pandas 数据框。列表的每一行都包含一个观察值，列表中的值由与该观察值匹配的相应行组成。这是我所拥有的一个简单版本
python - 将包含两部分的列转换为 MultiIndex
我有以下 DataFrame(从我无法更改的 CSV 文件中读取): df = pd.DataFrame([['low', 0.5, 123, 0.8, 123],
python - MultiIndex 来自两个索引的唯一值的乘积
我正在创建一个 MultiIndex.from_product()，但它必须是来自两个单独的 MultiIndexes 的唯一值的乘积。我下面的解决方案有效，但我想知道是否有更优雅的解决方案。 fro
python - 如何使用日期索引和多级列进行切片 (MultiIndex)
我有一个很大的pd.DataFrame，a，看起来像: bid TIT IM Equity HELN SE Equity FHZN SE Equity GLEN LN Equity f
python - 将其中一个索引作为元组的 MultiIndex
我创建了一个带有多索引的数据框，其中一个索引是一个元组。我无法使用 .loc 进行索引。这是数据框: a = [['a','a','a','b','b','b','c','c'],[('one',2
python - MultiIndex 数据帧的平均值
我有以下数据框 A B C D E F Algo T X
python - MultiIndex 的问题
我在使用 MultiIndex 和 stack() 时遇到问题。以下示例基于 solution from Calvin Cheung在 StackOvervlow 上。 === multi.csv =

首页

博学

6Ren·AI

商城

python - reshape MultiIndex 以分离

设置