python - 是否确保 df.corr() 列的顺序-6ren

python - 是否确保 df.corr() 列的顺序

转载作者：太空宇宙更新时间：2023-11-04 04:06:37

26

4

在 Pandas 中，我们可以用 .corr() 生成相关矩阵.我的问题很简单:是否保留了原始数据框的列顺序？从我的测试来看似乎是这样，但我想确定一下。

我问是因为我在 Python 3.7.3 上，其中字典维护插入顺序。我不知道当前的问题是否与此相关，但如果 Pandas 在幕后使用字典，那么 corr() 很可能在 Python 3.6+ 中按预期顺序排列但不是在较低版本中。

最佳答案

好吧，如果你看看 source code对于corr，开头的代码如下:

numeric_df = self._get_numeric_data()
        cols = numeric_df.columns
        idx = cols.copy()
        mat = numeric_df.values

正如您在此处看到的，只要方法 _get_numeric_data 保持顺序，corr 也应该保持顺序。深入了解 _get_numeric_data，您可以看到 this block :

self._consolidate_inplace()
return self.combine([b for b in self.blocks if b.is_numeric], copy)

_consolidate_inplace 在元组中构建数据帧的合并部分(保留顺序)，而 _get_numeric_data 使用列表理解将此元组过滤为仅数字 block (仍保留顺序) ).

更重要的是，pandas 实际上并没有为您的列名使用字典。 列本身是just instances Index 类，它(来自文档字符串)是有序的。

因此，回答您的问题:是的，corr 中保证了顺序，因为它获取和遍历数据框列的方式也保留了顺序。

关于python - 是否确保 df.corr() 列的顺序，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57225758/

26

4

0

文章推荐： Linux CentOS 服务器启动脚本 : Minecraft Server

文章推荐： css - 堆叠流体高度 divs

文章推荐： linux - Libnet 缺少一些定义标志

文章推荐： html - 多个 div 在一行上，间距均匀

从 Corr 矩阵返回最大相关性和行名称
我试图使用 cor 函数找到 data.frame 对象每一列中的最大相关性。假设这个对象看起来像 A N A B C
Pandas .corr() 返回 "__"
它运行良好，直到它不是，并且不知道我做错了什么。我已将其简化为一个非常简单的 datsaset t: 1 2 3 4 5 6 7 8 0 3 16 3
python - pandas .corr() 方法的进度条
我正在尝试使用 tqdm 或其他一些库在以下代码行中显示进度条: corrmatrix = adjClose.corr('spearman') 其中 adjClose 是一个数据框，其中包含许多股票代
python - pandas 数据框中两列的相关系数与 .corr()
我想在本质上创建列 bool 值后计算 Pandas 数据框的两列之间的相关系数。原版table有两列:一个 Group带有两个处理组之一的列，现在是 bool 值，还有一个 Age团体。这些是我要计
matlab - corr() 与稀疏矩阵 - MATLAB
我想知道 MATLAB 是否有一个工具箱可以对稀疏矩阵进行常见的矩阵运算。使用稠密矩阵，我可以计算相关图矩阵: R = rand(10,100) [r,p] = corr(R) 对于稀疏矩阵，我很想
r - 使用因子水平将 corr 函数应用于矩阵？
我正在尝试使用 corr() 函数来计算加权权重。它的工作方式是第一个参数应该是一个矩阵，其中有两列对应于我们希望计算其相关性的两个变量，第二个参数是要应用于每对观察值的权重向量。这是一个例子。 >
python - Pandas 成对算术类似于rolling().corr()
我有一个数据框如下: fsym EOS BTC BNB time
python - 使用 .corr 获取两列之间的相关性
我有以下 pandas 数据框 Top15: 我创建了一个列来估计每人可引用文档的数量: Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energ
python - pandas 'corr()' 是否应用于数据自动归一化？
我多次使用 pandas corr() 方法。但我不知道 pandas corr() 是否应用自动数据规范化。我知道必须在数据归一化之后进行关联。我的问题是，如果我使用 pandas corr()
python - Pandas df.corr - 跨多列的一个变量
我想创建一个相关性，其中一个变量作为自变量，多个附加变量作为因变量，然后将其转换为热图。我正在关注这些directions 。我的代码: df_corr_interest = df[df.colu
python - Pandas dataframe.corr() 从输入中剥离列
我正在学习如何在 python3 中使用 pandas 库，并且遇到了 dataframe.corr() 的问题这是我的数据集的示例 Date,Gender,Age at Booking,Curre
sql - postgresql corr 聚合函数返回 null
我有两个完美(或完全不完美？)相关的数字，我想找到它们之间的相关性。原始场景不同且更复杂，但问题出在 pg 使用的相关方法中的某个地方。请考虑以下查询: WITH all_series AS
python - 没有重叠的 Pandas rolling corr
我有几个价格返回系列，我想以日期之间没有重叠的方式计算滚动 N 天相关性，即，如果我的第一个相关矩阵属于 [2000-04-05 - 2000 -06-04]，下一个相关矩阵应该属于[2000-06-
python - .corr 如何删除 NA 和空值？
我是 pandas/python 的新手。我想知道函数 .corr 在计算相关性时如何删除具有多个变量的数据帧的空数据。例如，假设我有以下数据框: # 'A1' 'A2' 'A3' 1
python - 是否确保 df.corr() 列的顺序
在 Pandas 中，我们可以用 .corr() 生成相关矩阵.我的问题很简单:是否保留了原始数据框的列顺序？从我的测试来看似乎是这样，但我想确定一下。我问是因为我在 Python 3.7.3 上，
python - Pandas corr() 与 corrwith()
Pandas 提供两种不同关联函数的原因是什么？ DataFrame.corrwith(other, axis=0, drop=False): Correlation between rows or
python - 如何从 corr() 函数输出中删除 NaN 值
编辑以显示原始数据框的示例: df.head(4) shop category subcategory season date 20
r - R 中随机森林回归模型中的 corr.bias 参数
我在 R 中使用随机森林的回归模型，我发现参数 corr.bias 根据手册是“实验性的”，我的数据是非线性的，我只是想知道将此参数设置为 true 是否可以增强结果，加上我不知道它对于非线性数据到底
python - DataFrame.corr() - 使用相同的重复数据计算 PIL 逊线性相关性？
x=[0.3, 0.3, 0.3, ..., 0.3](0.3 的数量:10) y=x x 和 y 之间的线性相关系数是多少？对于此x 和y，所有对都指向同一点(0.3, 0.3)。我们可以说 x
python - Pandas corr() 返回 NaN 的频率太高
我正在尝试在数据帧上运行我认为应该是一个简单的相关函数，但它在我认为不应该返回的地方返回 NaN。代码: # setup import pandas as pd import io csv = io

首页

博学

6Ren·AI

商城

python - 是否确保 df.corr() 列的顺序