作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个这样的列表,称为数据
[(4.0, 7.8, u'MNR'),
(1.0, 6.4, u'MNR'),
(9.0, 25.2, u'MNR'),
(8.0, 5.8, u'MNR'),
(7.0, 177.8, u'MNR'),
(4.0, 10.0, u'MNR'),
(2.0, 5.6, u'MNR'),
(2.0, 29.6, u'MNR'),
(1.0, 7.4, u'MNR'),
(2.0, 2.8, u'MNR'),
(8.0, 3.0, u'MNR'),
(2.0, 8.4, u'MNR'),
(3.0, 4.2, u'MNR'),
(2.0, 11.8, u'MNR')]
pd.Index(data)
MultiIndex(levels=[[1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0],
我知道如何以这种方式获取数据:
data[0][0]
4.0
我想遍历列表并计算第一行中每个级别出现的次数。输出应该是这样的,第二列代表计数:
1.0 - 2
2.0 - 4
3.0 - 1
然后我想得到第二列的总和:
1.0 - 13.8
2.0 - 58.2
3.0 - 4.2
然后是平均
1.0 6.9
2.0 14.55
3.0 4.2
我尝试使用循环来完成此操作,并尝试使用 zip 认为,如果我可以将各个列表的前两个部分分别压缩到一个列表中,我将可以轻松地对这些列表执行操作:
for index, item in enumerate(data):
item.count(data[0][0])
zip(data[-3])
最佳答案
由于您使用的是 pd
和 MultiIndex
,我假设这确实是一个 pandas
问题。您可以使用 groupby
和 agg
一步完成此操作 ( groupby tutorial ),而无需逐一迭代:
>>> df = pd.DataFrame(data)
>>> df.groupby(0)[1].agg(["count", "sum", "mean"])
count sum mean
0
1 2 13.8 6.90
2 5 58.2 11.64
3 1 4.2 4.20
4 2 17.8 8.90
7 1 177.8 177.80
8 2 8.8 4.40
9 1 25.2 25.20
关于Python列表-按第一项进行分组,对第二项进行计数和求和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26564542/
我是一名优秀的程序员,十分优秀!