作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
<分区>
我有一个基本数据框 (df),它有多个交易,它有一个产品 ID 和一个值,假设它是销售价格,它不是固定的,所以它会采用以下形式:
id | product_id | sale_price
---+------------+-------------
1 | 1 | 100
2 | 1 | 100
3 | 2 | 98
4 | 3 | 22
5 | 1 | 95
| ... | ...
所以现在我想回答以下问题:每个 product_id 的平均价格(平均值)是多少,价格的变化,以及每个 product_id 的销售额是多少。
我正在做如下:
means = pd.DataFrame(df.groupby('item_id')['sale_price'].mean()).reset_index(level=0)
vars = pd.DataFrame(df.groupby('item_id')['sale_price'].var()).reset_index(level=0)
counts = pd.DataFrame(df.groupby('item_id')['sale_price'].count()).reset_index(level=0)
result = pd.merge(means, vars, on='item_id')
result = pd.merge(result, counts, on='item_id')
它做了我想要的,但我认为它非常愚蠢,必须有更好或“正确”的方法来做到这一点。有什么想法吗?
我是一名优秀的程序员,十分优秀!