python - Python 中 pandas cut、groupby 和 multiindex 的奇怪行为-6ren

python - Python 中 pandas cut、groupby 和 multiindex 的奇怪行为

转载作者：行者123 更新时间：2023-12-01 02:32:31

25

4

我有一个像这样的数据框，

                        Continent % Renewable
Country                                      
China                        Asia           2
United States       North America           1
Japan                        Asia           1
United Kingdom             Europe           1
Russian Federation         Europe           2
Canada              North America           5
Germany                    Europe           2
India                        Asia           1
France                     Europe           2
South Korea                  Asia           1
Italy                      Europe           3
Spain                      Europe           3
Iran                         Asia           1
Australia               Australia           1
Brazil              South America           5

其中% Renewable是使用剪切函数创建的列，

Top15['% Renewable'] = pd.cut(Top15['% Renewable'], 5, labels=range(1,6))

当我按大陆和%可再生能源分组来计算每个子集中的国家/地区数量时，

count_groups = Top15.groupby(['Continent', '% Renewable']).size()

也就是说，

Continent      % Renewable
Asia           1              4
               2              1
Australia      1              1
Europe         1              1
               2              3
               3              2
North America  1              1
               5              1
South America  5              1

奇怪的是现在的索引，如果我索引一个类别值> 0的值，这会给我该值，

count_groups.loc['Asia', 1]
>> 4

如果没有，

count_groups.loc['Asia', 3]
>> IndexingError: Too many indexers

因为该类别中没有条目，所以它不应该给我一个 0 吗？我认为该数据框是使用 groupby 创建的。

如果没有，任何人都可以建议一个程序，以便我可以将 0 个国家/地区保留为 % 可再生 类别吗？

最佳答案

您有一个带有多重索引的系列。通常，我们使用元组通过 MultiIndexes 进行索引，但 pandas 对此可以灵活处理。

在我看来， count_groups.loc[('Asia', 3)] 应该引发 KeyError，因为该对没有出现在索引中，但我猜这是由 pandas 开发人员决定的。

要从系列中返回默认值，我们可以像在字典中一样使用 get :

count_groups.get(('Asia', 3), 0)

如果键不存在，则返回 0。

关于python - Python 中 pandas cut、groupby 和 multiindex 的奇怪行为，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46651007/

25

4

0

文章推荐： python - 比较两个 Pandas 系列中的字符串条目

文章推荐： firefox - Mozilla Firefox 预取 rel ="next"

python - 动态规划 : Rod cutting and remembering where cuts are made
所以我在 python 中有这段代码，目前它只返回切割杆的最大值。我怎样才能修改它以让我也知道切割的位置？它采用一个价格列表，其指数 +1 对应于每个长度的杆的值(value)，n 对应于杆的长度。
bash - 这个使用 cut 和 sed 的 bash 脚本有什么问题(cut : command not found)?
我正在从 bash 中的 NFS 位置获取服务器和路径，如下所示: #!/bin/bash ST="/net/10.111.111.111/path/to/some/dir" echo $ST SER
linux - cut、colrm、awk 和 sed : fail to cut characters from a pipe stream 的奇怪问题
我已经创建了一个脚本来枚举目录及其下的所有文件。我想通过使用 pv 添加一些进度反馈，因为我通常从根目录使用它。问题是 find 在它的时间输出 (%TT) 中总是包含小数秒，但我不想记录那么多细节
java相当于unix cut
我不是java编码员，但需要一个可以执行的命令 cut -d "/" -f1,2,3 MyFile 有什么想法吗？最佳答案读取文件。在 / 上拆分每一行，然后打印出前三部分。 BufferedRe
R cut 函数中的舍入
有谁知道R如何在cut函数中选择有效位数？ y y breaks1 table(cut(y, breaks = breaks1, dig.lab = min(nchar(breaks1)))) #
python - "Cut off"终端和命令之间的链接
我创建了 pycharm Ubuntu中的命令，但我有一个小问题。当我执行命令时，pycharm 打开，但它仍然与终端相关。我的意思是如果我关闭终端，pycharm 最终也会关闭。有没有一种简单的方法
Unix cut 命令将一个无序列表作为参数
Unix cut command 需要一个字段列表，但不是我需要的顺序。 $ echo 1,2,3,4,5,6 | cut -d, -f 1,2,3,5 1,2,3,5 $ echo 1,2,3,4,
Unix cut，删除第一个标记
我正在尝试使用 Unix cut删除每行的前两个字段。我有表单的输入行 ( token )(空格)( token )(大量文本) 问题是有退出n每行 token ，所以我不能做这样的事情 cut -f
parsing - 在递归下降解析器中实现 "cut"
我正在用 Python 实现一个 PEG 解析器生成器，到目前为止我已经取得了成功，除了“cut”功能，任何了解 Prolog 的人都必须知道。这个想法是，在解析了剪切 ( ! ) 符号后，不应在同
R: cut 是执行此操作的正确功能吗？
我目前正在为剪切而苦苦挣扎......我不知道是否还有其他功能。我有一个包含值的大表和一个包含阈值的矩阵或向量。假设我有一个包含阈值 0.6、0.8、1.0、1.2、1.4 的矩阵我想找出一个值(
r - cut() - 包括最低值
我想使用 cut() 中定义的中断来剪切我的数据: x = c(-10:10) cut(x, c(-2,4,6,7)) [1] (-2,4] (-
R cut() 导致零的奇数处理
我正在使用 cut()以 0.05 的增量对从负值到正值的列表进行分类。但是，在 -0.05 到 0.05 范围内对零的处理会根据 cut 函数中使用的范围(参见下面的示例)而变化，因此我得到 [-0
r - cut 函数产生不均匀的初断
我正在探索 cut 函数的使用，并尝试将以下基本向量切割成 10 个断点。我可以做到，但我很困惑为什么我的初始中断发生在 -0.1 而不是 0: test_vec <- 0:10 test_vec2
multithreading - 如何并行使用Linux “cut”
我有一个大的制表符分隔文件(10TB)。我想按某些列削减文件，我想使用我的24个内核中的每一个并行执行此操作。 cut -f1,2,3 file > out 关于如何使用多个内核或并行执行此操作的任
shell - Cut 命令指定制表符作为分隔符
已关闭。这个问题是 off-topic 。目前不接受答案。想要改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。已关闭10 年前。 Improve th
vba - 使用vba从Excel禁用 "cut"
我已经阅读了有关此主题的许多主题，但我在那里找到的代码似乎不起作用。我正在尝试禁用 Excel 电子表格中的“剪切”功能，并且我希望该图标变灰。我一直在使用这段代码: Sub WorkSheet_A
r - 对循环数据使用 cut
我正在尝试使用“剪切”命令分析风力数据，我要设置16个风向我如何将方向 348.75 至 11.25 切割为“0”标签？谢谢埃利亚夫最佳答案这可能不是一个通用的临时解决方案，但您可以通过将
Java新手: cutting a string off?
我是编程新手(正在上课)，我不确定如何完成这项任务。 “忽略大小写，找到输入中最后一次出现的‘a’，并删除其后面的所有字符。如果单词中没有‘a’，则删除除前两个字符之外的所有字符(提醒:不要使用if语
bash - cut: 可以设置多个空格作为分隔符吗？
我有这样的文字: word1 word2 word3 word4 一对单词之间可能有多个空格，我想从每一行中获取一些单词列。当我使用 cat 文件时 | cut -d ' ' -f1,2,4 似
Python Pandas .cut
编辑:添加 defT 使用 pandas.cut 是否会改变 pandas.DataFrame 的结构。我按以下方式使用 pandas.cut 将单个年龄年份映射到年龄组，然后进行聚合。但是，聚合不

首页

博学

6Ren·AI

商城

python - Python 中 pandas cut、groupby 和 multiindex 的奇怪行为