- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章对Pandas MultiIndex(多重索引)详解由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
创建多重索引 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
In [
16
]: df
=
pd.DataFrame(np.random.randn(
3
,
8
), index
=
[
'A'
,
'B'
,
'C'
], columns
=
index)
In [
17
]: df
Out[
17
]:
first bar baz foo qux \
second one two one two one two one
A
0.895717
0.805244
-
1.206412
2.565646
1.431256
1.340309
-
1.170299
B
0.410835
0.813850
0.132003
-
0.827317
-
0.076467
-
1.187678
1.130127
C
-
1.413681
1.607920
1.024180
0.569605
0.875906
-
2.211372
0.974466
first
second two
A
-
0.226169
B
-
1.436737
C
-
2.006747
|
获得索引信息 。
get_level_values 。
1
2
3
4
5
|
In [
23
]: index.get_level_values(
0
)
Out[
23
]: Index([
'bar'
,
'bar'
,
'baz'
,
'baz'
,
'foo'
,
'foo'
,
'qux'
,
'qux'
], dtype
=
'object'
, name
=
'first'
)
In [
24
]: index.get_level_values(
'second'
)
Out[
24
]: Index([
'one'
,
'two'
,
'one'
,
'two'
,
'one'
,
'two'
,
'one'
,
'two'
], dtype
=
'object'
, name
=
'second'
)
|
基本索引 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
|
In [
25
]: df[
'bar'
]
Out[
25
]:
second one two
A
0.895717
0.805244
B
0.410835
0.813850
C
-
1.413681
1.607920
In [
26
]: df[
'bar'
,
'one'
]
Out[
26
]:
A
0.895717
B
0.410835
C
-
1.413681
Name: (bar, one), dtype: float64
In [
27
]: df[
'bar'
][
'one'
]
Out[
27
]:
A
0.895717
B
0.410835
C
-
1.413681
Name: one, dtype: float64
|
使用reindex对齐数据 。
数据准备 。
1
2
3
4
5
6
7
8
9
10
11
12
13
|
In [
11
]: s
=
pd.Series(np.random.randn(
8
), index
=
arrays)
In [
12
]: s
Out[
12
]:
bar one
-
0.861849
two
-
2.104569
baz one
-
0.494929
two
1.071804
foo one
0.721555
two
-
0.706771
qux one
-
1.039575
two
0.271860
dtype: float64
|
s序列加(0~-2)索引的值,因为s[:-2]没有最后两个的索引,所以为NaN.s[::2]意思是步长为1. 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
In [
34
]: s
+
s[:
-
2
]
Out[
34
]:
bar one
-
1.723698
two
-
4.209138
baz one
-
0.989859
two
2.143608
foo one
1.443110
two
-
1.413542
qux one NaN
two NaN
dtype: float64
In [
35
]: s
+
s[::
2
]
Out[
35
]:
bar one
-
1.723698
two NaN
baz one
-
0.989859
two NaN
foo one
1.443110
two NaN
qux one
-
2.079150
two NaN
dtype: float64
|
以上这篇对Pandas MultiIndex(多重索引)详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我.
原文链接:https://blog.csdn.net/claroja/article/details/72547815 。
最后此篇关于对Pandas MultiIndex(多重索引)详解的文章就讲到这里了,如果你想了解更多关于对Pandas MultiIndex(多重索引)详解的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我有一个包含 4 个级别的 MultiIndex 的 pandas 数据框。我正在尝试为每个 1 级索引选择具有不同 4 级索引的行。 例子: In [68]: df = pd.DataFrame({
我有一个数据框,其中包含 Year 和 Month 的多个索引,如下所示 | |Value Year |Month| | 1 | 3 1992 | 2 | 5
我有一个带有 3 级 MultiIndex 的 pandas 数据框。我正在尝试根据对应于两个级别的值列表提取此数据帧的行。 我有这样的事情: ix = pd.MultiIndex.from_prod
我想将具有多索引的数据帧中的所有列除以另一个具有多索引的数据帧,更小一级。前两个水平的蛾指数是相同的。并且应该播放第三级。 df_0 = pd.DataFrame( { "col0": [ 1
我想知道是否有人可以帮助我解决这个问题。 如果我有一个简单的数据框: one two three four 0 A 1 a 1 1 A 2 b
我希望创建一个新的 DataFrame,与基于芯片的设备 A 和 B 的结果相对应。 以下是我创建 DataFrame 的代码: import numpy as np import pandas as
我希望创建一个新的 DataFrame,与基于芯片的设备 A 和 B 的结果相对应。 以下是我创建 DataFrame 的代码: import numpy as np import pandas as
请让我知道如何将两个 DataFrame 与排序的 MultiIndexes 连接起来,以便结果具有排序的 MultiIndex。 由于两者都是排序的,算法必须根据两个 DataFrame 中的总行数
基本场景 对于推荐服务,我正在针对一组用户-项目交互训练矩阵分解模型 (LightFM)。为了使矩阵分解模型产生最佳结果,我需要将我的用户 ID 和商品 ID 映射到从 0 开始的连续整数 ID 范围
好的,所以我有一个数据框,其中包含时间序列数据,每列都有一个多行索引。这是数据的样例,它是 csv 格式的。加载数据在这里不是问题。 我想要做的是能够创建一个箱线图,其中包含根据多索引特定行中的不同类
我有这个数据框: df = pd.DataFrame({'NUMBER_1': {('2019-07', 'A'): 4, ('2019-07', 'D'): 2, ('2019-08', 'A'):
我有点难以对用于我的一个数据集的列的 pandas MultiIndex 进行排序: MultiIndex(levels=[['Jan', 'Feb', 'Mar', 'Apr', 'May', 'J
我有点难以对用于我的一个数据集的列的 pandas MultiIndex 进行排序: MultiIndex(levels=[['Jan', 'Feb', 'Mar', 'Apr', 'May', 'J
我有一个列表列表,我想将其制成多索引 Pandas 数据框,然后可以合并到原始 Pandas 数据框。列表的每一行都包含一个观察值,列表中的值由与该观察值匹配的相应行组成。 这是我所拥有的一个简单版本
我有以下 DataFrame(从我无法更改的 CSV 文件中读取): df = pd.DataFrame([['low', 0.5, 123, 0.8, 123],
我正在创建一个 MultiIndex.from_product(),但它必须是来自两个单独的 MultiIndexes 的唯一值的乘积。我下面的解决方案有效,但我想知道是否有更优雅的解决方案。 fro
我有一个很大的pd.DataFrame,a,看起来像: bid TIT IM Equity HELN SE Equity FHZN SE Equity GLEN LN Equity f
我创建了一个带有多索引的数据框,其中一个索引是一个元组。我无法使用 .loc 进行索引。 这是数据框: a = [['a','a','a','b','b','b','c','c'],[('one',2
我有以下数据框 A B C D E F Algo T X
我在使用 MultiIndex 和 stack() 时遇到问题。以下示例基于 solution from Calvin Cheung在 StackOvervlow 上。 === multi.csv =
我是一名优秀的程序员,十分优秀!