python - panda的多索引的好处？-6ren

python - panda的多索引的好处？

转载作者：IT老高更新时间：2023-10-28 21:53:51

27

4

所以我了解到我可以使用 DataFrame.groupby 而不需要 MultiIndex 来进行子采样/横截面。

另一方面，当我在 DataFrame 上有一个 MultiIndex 时，我仍然需要使用 DataFrame.groupby 来进行子采样/横截面。

那么，除了在打印时非常有用且漂亮地显示层次结构之外，MultiIndex 还有什么用处？

最佳答案

在 pandas 0.4 版本中引入了分层索引(也称为“多级”索引)。

这为一些非常复杂的数据分析和操作打开了大门，特别是对于处理更高维度的数据。从本质上讲，它使您能够在二维表格结构 (DataFrame) 中有效地存储和操作任意高维数据。

想象一下像这样使用 MultiIndex 构造一个数据框:-

import pandas as pd
import numpy as np

np.arrays = [['one','one','one','two','two','two'],[1,2,3,1,2,3]]

df = pd.DataFrame(np.random.randn(6,2),index=pd.MultiIndex.from_tuples(list(zip(*np.arrays))),columns=['A','B'])

df  # This is the dataframe we have generated

          A         B
one 1 -0.732470 -0.313871
    2 -0.031109 -2.068794
    3  1.520652  0.471764
two 1 -0.101713 -1.204458
    2  0.958008 -0.455419
    3 -0.191702 -0.915983

这个df只是一个二维的数据结构

df.ndim

2

但是我们可以把它想象成一个 3 维数据结构。

one 与 1 与数据 -0.732470 -0.313871。
one 与 2 与数据 -0.031109 -2.068794。
one with 3 with data 1.520652 0.471764。

A.k.a.:“在二维表格结构中有效地存储和操作任意高维数据”

这不仅仅是一个“漂亮的展示”。由于我们现在有一个层次索引，因此它具有易于检索数据的好处。

例如。

In [44]: df.ix["one"]
Out[44]: 
          A         B
1 -0.732470 -0.313871
2 -0.031109 -2.068794
3  1.520652  0.471764

只会为属于“one”的数据组提供一个新的数据框。

我们可以通过这样做进一步缩小我们的数据选择范围:-

In [45]: df.ix["one"].ix[1]
Out[45]: 
A   -0.732470
B   -0.313871
Name: 1

当然，如果我们想要一个特定的值，这里有一个例子:-

In [46]: df.ix["one"].ix[1]["A"]
Out[46]: -0.73247029752040727

因此，如果我们有更多索引(除了上面示例中显示的 2 个索引)，我们基本上可以深入并选择我们真正感兴趣的数据集，而无需 groupby。

我们甚至可以从数据框中获取横截面(行或列)...

按行:-

In [47]: df.xs('one')
Out[47]: 
          A         B
1 -0.732470 -0.313871
2 -0.031109 -2.068794
3  1.520652  0.471764

按列:-

In [48]: df.xs('B', axis=1)
Out[48]: 
one  1   -0.313871
     2   -2.068794
     3    0.471764
two  1   -1.204458
     2   -0.455419
     3   -0.915983
Name: B

关于python - panda的多索引的好处？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13226029/

27

4

0

文章推荐： node.js - 模块版本不匹配。预期 11，得到 1

文章推荐： node.js - Fluxible 中的“脱水”和“再水合”代表什么？

文章推荐： javascript - 如何在 node.js 中处理 POST 请求

文章推荐： Android ListView Header 禁用点击

javascript - 有序函数定义 |好处
如果函数定义顺序不对，Jslint 将指出错误。显然 jslint 是严格的，但我想知道将函数按顺序排列是否有任何好处。我的意思是在调用它们之前定义它们。最佳答案函数定义(和 var 语句)被
hardware - 基于三进制 'bit' 的计算机有什么实际用途/好处？
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
python - 将我的网站上传到公共(public)存储库有哪些风险/好处？
我注意到Flask tutorial涉及到点的使用。看起来它只是用于在本地创建一个轮子，这将使服务器上的设置变得更容易，但作为一个网络开发新手，我很好奇:是否有人真的会一路将他们的网站上传到像 PyP
jquery - 使用 live() - 好处 - 类似于 bind()
我一直在阅读有关 jquery live event 的内容，但仍然有点困惑？使用它有什么好处？ http://docs.jquery.com/Events/live 我知道它与绑定(bind)类似，
cordova - AndroidX 过渡和 Cordova，有哪些风险/好处？
这是我的故事:我已将我的应用迁移到 AndroidX，因为我需要从网上找到的库中获取一些新功能。问题:我目前遇到了一些问题，因为我现在需要为 Cordova 开发一个插件来实现该应用程序的一部分。
unit-testing - RAD:依赖注入(inject) - 好处？
在使用 RAD 或一般不使用单元测试时使用依赖注入(inject)是否有任何好处？最佳答案是的，有以下几个好处: 减少依赖减少依赖携带更多可重用代码更多可测试代码更具可读性的代码更多引用
wix - 使用 MSM 代替 MSI 有哪些限制/好处？
我目前正在构建一个通过 MSI Windows Installer 分发的产品。我们的客户正在使用不同的形式(例如我们在他们自己的 MSI 中)集成该产品，使用 Bootstrap /链接器(如 Wi
language-agnostic - Scala 中的类型系统是图灵完备的。证明？例子？好处？
有人声称 Scala 的类型系统是图灵完备的。我的问题是: 这有正式的证据吗？简单的计算在 Scala 类型系统中会是什么样子？这对 Scala 这种语言有什么好处吗？与没有图灵完备类型系统的语言
javascript - React 新手，关于使用所有 JS 而不是 HTML 的问题/好处/缺点？
我开始尝试使用 React，我注意到我正在制作的简单应用程序全部使用 JS。我的 html 页面只是一个空的 body 标签! 所以我有几个问题，因为我是这个框架的新手。我的整个应用程序应该基本上都
.net - Windows VB.NET 1.1 到 2.0 升级 - 好处？
我们有一个相当大的基于 Windows 的 1.1 .NET 应用程序，我们正在考虑升级到 2.0。我们考虑更新的主要原因是我们可以利用 Visual Studio 2008 进行项目的持续开发，以及
jquery - 使用 ajax 分页更改 rel ='next' 和 rel ='prev' href 值以获得 SEO 好处
我有一个页面，其中内置了基于 ajax 的分页。分页用于页面中的“评论”功能。根据 Google 的网站管理员博客，具有 rel="next"和 rel="prev"值有利于 SEO。我在头部添加了

首页

博学

6Ren·AI

商城

python - panda的多索引的好处？