python - 为什么 Pandas Panel 的轴顺序困惑？-6ren

python - 为什么 Pandas Panel 的轴顺序困惑？

转载作者：行者123 更新时间：2023-12-01 04:33:39

27

4

在 Pandas 面板中，轴的顺序对我来说似乎真的很困惑。为什么会这样？

这就是我的意思:

In [120]: import pandas as pd

In [121]: import numpy as np

In [122]: pnl = pd.Panel(np.random.randn(33, 55, 77))

In [123]: pnl.shape
Out[123]: (33, 55, 77)

In [124]: pnl[0].shape
Out[124]: (55, 77)

In [125]: pnl[0][0].shape
Out[125]: (55,)

因此，它从轴 0、1、2 的形状 (33, 55, 77) 开始。伟大的。如果我用 pnl[0] 去掉索引，它会去掉第一个轴(长度 33)并留下形状 (55, 77)。还是很棒的。但是，当我使用 pnl[0][0] 取消另一个索引时，它不会取消前两个轴(长度 33, 55)并留下形状 (77,) 作为我有理由期待。没有。它决定，这一次，它将取消 last 轴而不是 first 轴，并留下形状 (55,)。哈？!？!为什么这么乱？有人可以向我解释一下这背后的设计逻辑吗？

PS。我真的很想使用面板，但现在由于这个轴问题我没有使用它。有时它会使代码不必要地困惑。

更新:

先生。 F 在下面给出了一个答案，基本上建议一致使用 pnl.ix[...] 而不是使用 pnl[...]。所以，我尝试了一下。然而，我仍然遇到了非常奇怪/令人困惑的行为。

这是一个示例，使用上面定义的相同 pnl 对象:

In [220]: pnl.shape
Out[220]: (33, 55, 77)

In [221]: pnl.ix[:, 0, 0].shape
Out[221]: (33,)

In [222]: pnl.ix[0, :, 0].shape
Out[222]: (55,)

In [223]: pnl.ix[0, 0, :].shape
Out[223]: (77,)

In [224]: pnl.ix[:, :, 0].shape
Out[224]: (55, 33)

In [225]: pnl.ix[:, 0, :].shape
Out[225]: (77, 33)

In [226]: pnl.ix[0, :, :].shape
Out[226]: (55, 77)

当我去掉 2 个轴并只留下 1 个轴(上面的命令 221-223)时，一切看起来都很棒。但是，当我去掉 1 个轴以留下 2 个轴(上面的命令 224-226)时，生成的形状再次变得无意义。很难理解并习惯生成的形状如何神奇地交换轴顺序，但只是有时! (具体来说，命令 226 的结果形状 (55, 77) 符合我的预期。但是，在命令 224 中，我期望结果形状 (33, 55) 而不是 (55, 33)；在命令 225 中，我期望结果形状结果形状 (33, 77) 而不是 (77, 33)。)

最佳答案

问题在于 item-getter 语法(使用方括号 [] 获取维度)不是您想要的那种东西。您想要的是确保您按照指定的维度子索引到数据中。

为此，您可以使用ix:

 pnl.ix[0, 0].shape
 (77,)

通过查看您尝试过的每件事的类型，您可以对此有所了解:

In [71]: type(pnl.ix[0, 0])
Out[71]: pandas.core.series.Series

In [72]: type(pnl.ix[0])
Out[72]: pandas.core.frame.DataFrame

In [73]: type(pnl[0])
Out[73]: pandas.core.frame.DataFrame

特别是最后两个正在查看相同的子数据帧，但请考虑之间的区别:

(pnl[0])[0]
# Or, (pnl.ix[0])[0]

和

pnl.ix[0, 0] 
# Or, (pnl.ix[0]).ix[0]

在第一种情况下，您会说“嘿，继续并完全执行操作 'pnl[0]' 并返回任何内容，然后之后继续并再次获取第 0 个元素”。

由于pnl[0]是一个DataFrame，那么额外的[0] item-get操作将与df[0]相同code> 对于任何旧的 DataFrame，它将尝试提取该列(如果存在)。列维度将是生成的 DataFrame 的第一个维度，这就是为什么它的长度为 55，而不是行长度为 77。

要点是，在 Python 中，foo[x] 只是表示“使用 调用 foo 的特殊 __getitem__ 方法>x 作为参数”，仅此而已。如果与 DataFrame 一样，它有一个特殊的约定(例如引用一个列)，该约定与您在数学符号中可能期望的不同(在这种情况下，它将引用 中的一个项目)第一个轴，无论形状或结构如何)，这只是一个实现细节。

例如，使用纯 NumPy 数组，重复的项目获取会执行您所期望的操作:

In [90]: pnl.values[0][0].shape Out[90]: (77,)
这并不意味着这是“正确”的做法或任何事情。这只是恰好符合数学线性代数某些约定的一种方式。由于 DataFrame 寻求表示关系数据模型而不是纯粹的多维数组，因此没有理由期望 Pandas 必须在这种行为中模拟 NumPy。
添加了超过 2 个维度
对于超过 2 维的情况，与原始 3-D 面板中的布局方式相比，这些切片操作代表了数据的隐式转置。所以Pandas必须做一些事情来解决子选择数据的布局，而且似乎在这样做时，Pandas只是没有实现切片方法以保证子选择数据的从左到右的顺序轴被保留。
因此，当数据按 block 布局时，它似乎独立于其从父面板数据存储的内容来确定新的主(索引)轴。
例如，我创建了一个具有相同形状的随机数据集，我看到:

In [22]: pnl.ix[:, 0, :]._data Out[22]: BlockManager Items: Int64Index([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32], dtype='int64') Axis 1: Int64Index([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76], dtype='int64') FloatBlock: slice(0, 33, 1), 33 x 77, dtype: float64
特别注意最后一行，它表示它确实知道它是一个 33 x 77 的 block 。然而，当我们查看该 block 的 DataFrame 表示时:

In [23]: pnl.ix[:, 0, :].shape Out[23]: (77, 33)
所以你说得很对，Pandas 重新确定轴顺序的这种任意且未记录的过程是有问题的。这个例子应该被正确地归档为一个错误，要么是因为轴顺序没有保留，要么是因为用于确定将生成哪种顺序的任何条件都没有记录。 Pandas 团队应该提供其中之一。

关于python - 为什么 Pandas Panel 的轴顺序困惑？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32028995/

27

4

0

文章推荐： java - 将 TextView 或 TextView 数组传递给 Android 中的函数

文章推荐： javascript 正则表达式后面不跟特定字符

文章推荐： python - Django 从三个相关表获取信息。连接表

变异操作的 GraphQL 顺序
我正在创建一个有效的突变，但我不确定它是否按照我认为的方式工作。但是，我想知道执行顺序是什么？异步从上到下同步同步随机顺序其他我想确保在执行插入/更新插入之前从表中删除某些项目。使用以下突变
isabelle - field 顺序
如何更改规则中的前提顺序？例如，在伊莎贝尔的自然演绎规则中: mp: ?P ⟶ ?Q ⟹ ?P ⟹ ?Q 我们可以将顺序更改为: ?P ⟹ ?P ⟶ ?Q ⟹ ?Q 我可以用 rev_mp或者定义一
java - LinkedHashMap 顺序
关闭。这个问题需要details or clarity .它目前不接受答案。想改善这个问题吗？通过 editing this post 添加详细信息并澄清问题. 8年前关闭。 Improve thi
按关联的 hibernate 顺序
我正在使用 Hibernate 3.2，并使用标准来构建查询。我想为多对一关联添加和“排序”，但我不知道如何做到这一点。 Hibernate 查询最终看起来像这样，我猜: select t1.a, t
Javascript:顺序，而不是并行
我正在开发一个项目，但无法让我的 javascript 按顺序工作。我知道 javascript 可以并行执行任务，因此当您向不响应的服务器发出请求时，它不会被卡住。这有它的优点和缺点。就我而言，这是
dart - future 顺序
在下面的代码中，我认为f1 > f2 > f3是调用顺序，但是仅f1被调用。如何获得依次调用的3个函数？我已经将以下内容添加到main函数中，它可以按预期工作，但是我想知道是否还有其他确定的方法可以
javascript - 在对象数组中添加位置/顺序
我有一个如下所示的对象数组: [{ "id": 1, "Size": 90, "Maturity": 24, }, { "id": 2, "S
docker - Docker多阶段构建:顺序
这是征求意见和要求的请求。我是Docker的新手。我想要一个用于Python项目的生产和开发容器(可能也进行单元测试)。我的搜索指向多阶段Dockerfile(以及运行它们的多个docker-com
r - 所有可能的组合(顺序)
我想知道解决以下问题的有效方法是什么: 假设我在组 1 中有三个字符，在组 2 中有两个字符: group_1 = c("X", "Y", "Z") group_2 = c("A", "B") 显然，
Cordova Hook 顺序
在 Cordova 网站上，您可以看到一长串按字母顺序排列的钩子(Hook)列表，但它们触发和执行的正确顺序是什么？我正在尝试在构建/编译之前将 cordova.js 脚本添加到 index.htm
r - 所有可能的组合(顺序)
我想知道解决以下问题的有效方法是什么: 假设我在组 1 中有三个字符，在组 2 中有两个字符: group_1 = c("X", "Y", "Z") group_2 = c("A", "B") 显然，
JAVA HashSet 顺序
这个问题已经有答案了: 奥 git _a (2 个回答) 已关闭 9 年前。这是我的一个练习的代码， public class RockTest { public static void main(
java - java中哪些数据结构支持排序/顺序
我使用 HashMap 来存储一些数据，但每当新数据保存到 HashMap 或旧数据移出 HashMap 时，我都需要将其保持升序。但是hashmap本身不支持顺序，我可以使用什么数据结构来支持顺序？
f# - 顺序 - 随后几年的同一日期
我想创建一个序列，当星期几与函数参数中的日期相同时，它会返回所有年份的结果(例如:自开始日期起，2 月 12 日为星期日的所有年份)。 let myDate (dw:System.DayOfWeek)
C# LINQ 顺序
我有一个包含许多元素的 Xelement。我有以下代码来对它们进行排序: var calculation = from y in x.Elements("row")
Javascript Action 顺序
假设我有: 在 javacript 文件中，我为类按钮和 ID 名称定义了点击操作，例如: $("#name").click(function(event){ alert("hi"); }) $
Swift LayoutSubViews 顺序
我有一个包含 2 个 subview 的 View - collectionView 和自定义 View 。我想设置一个操作在布置 2 个 View 后运行，但layoutSubViews 运行了两次
Java 顺序 UUID
关闭。这个问题需要更多 focused .它目前不接受答案。想改进这个问题？更新问题，使其仅关注一个问题 editing this post . 2年前关闭。 Improve this questi
c++ - 如何比较两个双向迭代器的(顺序)？
我想知道 C++ 中是否有内置方法来比较两个双向迭代器的顺序。例如，我有一个 Sum 函数来计算同一列表中 2 个迭代器之间的总和: double Sum(std::list::const_itera
MySQL ORDER BY 顺序
在 MySQL 中，这两个查询之间有区别吗？ SELECT * FROM .... ORDER BY Created,Id DESC 和 SELECT * FROM .... ORDER BY Cre

首页

博学

6Ren·AI

商城

python - 为什么 Pandas Panel 的轴顺序困惑？