作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想知道是否有更好的方法来计算 Pandas 中父总份额,与下面的方法相比:非常感谢您的帮助!
raw_data = {'product': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
'revenue': [10,20,20,0,50,50,0,0,30]}
df = pd.DataFrame(raw_data, columns = ['product', 'revenue'])
unique_values = df['product'].unique()
L = pd.DataFrame ()
for value in unique_values:
small_df = df[df['product']==value]
small_df['shares'] = small_df['revenue']/small_df['revenue'].sum()
L = L.append(small_df, ignore_index=True)
print(L)
最佳答案
试试这个:
df['shares'] = df.groupby('product')['revenue'].apply(lambda x: x/ x.sum())
In [898]: df
Out[898]:
product revenue shares
0 A 10 0.2
1 A 20 0.4
2 A 20 0.4
3 B 0 0.0
4 B 50 0.5
5 B 50 0.5
6 C 0 0.0
7 C 0 0.0
8 C 30 1.0
关于python - 计算 Pandas DataFrame 中父级总数的份额,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52909883/
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 11 年前。 Improve thi
我有一个名为 df 的 Pandas DataFrame,它包含 n 列。 列 之一名为COUNT,它显示A 中的值出现了多少次。 A 包含唯一标识符,因此每一行在 column COUNT 中的值为
我有一个非常简单的 java 程序,可以打印出 100 万个随机数。在 linux 中,我观察了这个程序在其生命周期中占用的 %CPU,它从 98% 开始,然后逐渐减少到 2%,从而导致程序非常慢。哪
我正在使用 (EC)DHE 加密类型 x25519,我在计算共享 key 时遇到了一个大问题。 我有三个键: 爱丽丝的私钥: a : "984a382e1e48d2a522a0e81b92fd1351
我是一名优秀的程序员,十分优秀!