- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在 Pandas 面板中,轴的顺序对我来说似乎真的很困惑。为什么会这样?
这就是我的意思:
In [120]: import pandas as pd
In [121]: import numpy as np
In [122]: pnl = pd.Panel(np.random.randn(33, 55, 77))
In [123]: pnl.shape
Out[123]: (33, 55, 77)
In [124]: pnl[0].shape
Out[124]: (55, 77)
In [125]: pnl[0][0].shape
Out[125]: (55,)
因此,它从轴 0、1、2 的形状 (33, 55, 77) 开始。伟大的。如果我用 pnl[0]
去掉索引,它会去掉第一个轴(长度 33)并留下形状 (55, 77)。还是很棒的。但是,当我使用 pnl[0][0]
取消另一个索引时,它不会取消前两个轴(长度 33, 55)并留下形状 (77,) 作为我有理由期待。没有。它决定,这一次,它将取消 last 轴而不是 first 轴,并留下形状 (55,)。哈?!?!为什么这么乱?有人可以向我解释一下这背后的设计逻辑吗?
更新:
先生。 F 在下面给出了一个答案,基本上建议一致使用 pnl.ix[...]
而不是使用 pnl[...]
。所以,我尝试了一下。然而,我仍然遇到了非常奇怪/令人困惑的行为。
这是一个示例,使用上面定义的相同 pnl
对象:
In [220]: pnl.shape
Out[220]: (33, 55, 77)
In [221]: pnl.ix[:, 0, 0].shape
Out[221]: (33,)
In [222]: pnl.ix[0, :, 0].shape
Out[222]: (55,)
In [223]: pnl.ix[0, 0, :].shape
Out[223]: (77,)
In [224]: pnl.ix[:, :, 0].shape
Out[224]: (55, 33)
In [225]: pnl.ix[:, 0, :].shape
Out[225]: (77, 33)
In [226]: pnl.ix[0, :, :].shape
Out[226]: (55, 77)
当我去掉 2 个轴并只留下 1 个轴(上面的命令 221-223)时,一切看起来都很棒。但是,当我去掉 1 个轴以留下 2 个轴(上面的命令 224-226)时,生成的形状再次变得无意义。很难理解并习惯生成的形状如何神奇地交换轴顺序,但只是有时! (具体来说,命令 226 的结果形状 (55, 77) 符合我的预期。但是,在命令 224 中,我期望结果形状 (33, 55) 而不是 (55, 33);在命令 225 中,我期望结果形状结果形状 (33, 77) 而不是 (77, 33)。)
最佳答案
问题在于 item-getter 语法(使用方括号 []
获取维度)不是您想要的那种东西。您想要的是确保您按照指定的维度子索引到数据中。
为此,您可以使用ix
:
pnl.ix[0, 0].shape
(77,)
通过查看您尝试过的每件事的类型
,您可以对此有所了解:
In [71]: type(pnl.ix[0, 0])
Out[71]: pandas.core.series.Series
In [72]: type(pnl.ix[0])
Out[72]: pandas.core.frame.DataFrame
In [73]: type(pnl[0])
Out[73]: pandas.core.frame.DataFrame
特别是最后两个正在查看相同的子数据帧,但请考虑之间的区别:
(pnl[0])[0]
# Or, (pnl.ix[0])[0]
和
pnl.ix[0, 0]
# Or, (pnl.ix[0]).ix[0]
在第一种情况下,您会说“嘿,继续并完全执行操作 'pnl[0]
' 并返回任何内容,然后之后 继续并再次获取第 0 个元素”。
由于pnl[0]
是一个DataFrame,那么额外的[0]
item-get操作将与df[0]
相同code> 对于任何旧的 DataFrame,它将尝试提取该列(如果存在)。列维度将是生成的 DataFrame 的第一个维度,这就是为什么它的长度为 55,而不是行长度为 77。
要点是,在 Python 中,foo[x]
只是表示“使用 调用
作为参数”,仅此而已。如果与 DataFrame 一样,它有一个特殊的约定(例如引用一个列),该约定与您在数学符号中可能期望的不同(在这种情况下,它将引用 中的一个项目)第一个轴,无论形状或结构如何),这只是一个实现细节。 foo
的特殊 __getitem__
方法>x
例如,使用纯 NumPy 数组,重复的项目获取会执行您所期望的操作:
In [90]: pnl.values[0][0].shape
Out[90]: (77,)
这并不意味着这是“正确”的做法或任何事情。这只是恰好符合数学线性代数某些约定的一种方式。由于 DataFrame 寻求表示关系数据模型而不是纯粹的多维数组,因此没有理由期望 Pandas 必须在这种行为中模拟 NumPy。
添加了超过 2 个维度
对于超过 2 维的情况,与原始 3-D 面板中的布局方式相比,这些切片操作代表了数据的隐式转置。所以Pandas必须做一些事情来解决子选择数据的布局,而且似乎在这样做时,Pandas只是没有实现切片方法以保证子选择数据的从左到右的顺序轴被保留。
因此,当数据按 block 布局时,它似乎独立于其从父面板数据存储的内容来确定新的主(索引)轴。
例如,我创建了一个具有相同形状的随机数据集,我看到:
In [22]: pnl.ix[:, 0, :]._data
Out[22]:
BlockManager
Items: Int64Index([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,
17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32],
dtype='int64')
Axis 1: Int64Index([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,
17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50,
51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,
68, 69, 70, 71, 72, 73, 74, 75, 76],
dtype='int64')
FloatBlock: slice(0, 33, 1), 33 x 77, dtype: float64
特别注意最后一行,它表示它确实知道它是一个 33 x 77 的 block 。然而,当我们查看该 block 的 DataFrame
表示时:
In [23]: pnl.ix[:, 0, :].shape
Out[23]: (77, 33)
所以你说得很对,Pandas 重新确定轴顺序的这种任意且未记录的过程是有问题的。这个例子应该被正确地归档为一个错误,要么是因为轴顺序没有保留,要么是因为用于确定将生成哪种顺序的任何条件都没有记录。 Pandas 团队应该提供其中之一。
关于python - 为什么 Pandas Panel 的轴顺序困惑?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32028995/
我有一个程序可以打开一个窗口并快速改变背景颜色并随机弹出矩形和椭圆形。我的代码有效,但我不知道为什么,因为我没有在我的代码中调用 repaint() 函数。当我使用我个人的 update() 函数包含
var allRapidSpells = $$('input[value^=RSW]'); 谁能告诉我这是做什么的? 最佳答案 我敢猜测您正在使用 MooTools ,一个 JavaScript 框架
我有一个抽象父类,它有多个子类。我希望 child 能够拥有一个对于该 child 的每个实例都相同的变量。我不想将构造函数传递给 child 来告诉它它的名字,因为当它可以被硬编码时,这看起来很愚蠢
我刚刚在 Git 存储库上做了一些糟糕的事情,我不知道如何解决这个问题。我什至不知道我是怎么把它弄成这样的……! 在存储库(托管在 git hub 上)上,有 3 个我感兴趣的分支:master、br
我是 GIT 的新手,在理解提交日志图时遇到问题。 我感觉每条平行线都是一个分支。虽然我的源代码只有 2 个分支。我在下面提供的提交日志图中看到 3-4 条平行线(Microsoft Team Ser
我是 WPF 的新手,ScrollViewer 让我很沮丧。要么我只是没有“得到”它,要么它是一种有限的控制。 这是我的挫折: 水平滚动错误 水平滚动条仅在列表底部可见(我必须滚动到底部才能看到) 坏
那么 $('table.selectable td.capable input:text') 比 $('table.selectable td input:text') 更好吗?换句话说,指定一个类会
我刚刚完成了计算机图形学类(class),我们必须对光线追踪器进行编程。尽管所有结果都是正确的,但我对 OpenMP 的使用感到困惑(顺便说一句,这不是类(class)的一部分)。我有这个循环(C++
与 PatternSynonyms ( explicitly bidirectional form ),pattern-to-expr 方程实际上形成了一个函数,但拼写为大写(假设您最终得到正确类型的
我是 javascript/coffeescript 新手。 有人可以解释一下为什么这个 CoffeeScript/JavaScript 会毫无延迟地快速通过吗?我对第一种情况的想法是,它是对 upd
如果我调用document.getElementsByClassName('cl'),我会得到一个 HTMLCollection。它似乎包含 Element 对象而不是 HTMLElement 对象,
这是我本月的 azure payasyougo 使用费用。 我很难理解为什么我要为标准中型应用服务付费,我认为它会包含在计算时间中?我只运行一个云服务,这对于一个没有做太多事情的云服务来说似乎有点陡峭
除了the issue I am already having之外,我还在I saw a video on it之后安装了HBase(尚未安装)之前,还安装了Zookeeper。在安装它时,我遇到了许
我正在将 XSLT 与 regexp:match exslt 函数一起使用。上述函数采用 JavaScript Regex 模式。因此,我尝试匹配一组数字 1 到 3 OR 5 到 7 OR 9 到
我想知道为什么这段代码会给出消息:SyntaxError:意外的标记其他。 var compare = function(choice1,choice2){ if(choice1===choice2)
我尝试使用复选框和 JQuery 过滤日历上的事件, $(document).ready(function () { $('.scrollable-menu :checkbox').click(f
假设我们有一个用户想要一个名为:“test/lasdhjal.txt”,无论如何。现在,如果我将其放入新的文件(输入)中;对象里面,它会认为 test/是一个文件夹,而它是名称的一部分。我能做什么呢?
问题是 stash 的更改不会留在我 stash 它们的分支中。其他分支存储将被覆盖示例: 我愿意: git checkout iss4 // made some changes gi
我是一个 java 新手,并且在 StackOverflow 错误/在类之间访问文件的能力方面遇到了一个非常令人困惑的问题。我知道根本原因可能是我进行了一些递归调用,但修复它的语法却让我无法理解。我认
public X createData(int n) { int[] values = new int[n]; Random rand = new Random(); for
我是一名优秀的程序员,十分优秀!