作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
你能帮我破解一下计算吗?
我有下表:
我需要做的是将预期频率计算为(行总计 * 列总计)/总计
我假设我需要迭代行和列。我尝试这样做:
for i, row in df_dropped.iterrows():
for j, column in row.iteritems():
data[row][column] = df_dropped.iloc[i, 3] * df_dropped.iloc[2, j]
出现错误:基于位置的索引只能有[整数、整数切片(包含起始点、排除结束点)、整数列表、 bool 数组]类型
我做错了什么?
最佳答案
使用numpy.outer
对于最后一列和最后一行的外积并除以
由 loc
选择的标量到 numpy 数组:
t = df.loc['col_sum', 'row_sum']
arr = np.outer(df['row_sum'], df.loc['col_sum']) / t
然后通过构造函数创建 DataFrame,并使用索引删除最后一列和行:
df1 = pd.DataFrame(arr[:-1, :-1],
columns=df.columns[:-1],
index=df.index[:-1]).add_prefix('exp_')
print (df1)
exp_satisfied exp_neutral exp_dissatisfied
0 24.605263 20.842105 9.552632
1 145.394737 123.157895 56.447368
获取新的列名称:
cols = [item for x in df.columns[:-1] for item in (x, 'exp_' + x)]
print (cols)
['satisfied', 'exp_satisfied', 'neutral', 'exp_neutral', 'dissatisfied', 'exp_dissatisfied']
df = pd.concat([df.iloc[:-1, :-1], df1], axis=1).reindex(columns=cols)
print (df)
satisfied exp_satisfied neutral exp_neutral dissatisfied \
0 30 24.605263 17 20.842105 8
1 140 145.394737 127 123.157895 58
exp_dissatisfied
0 9.552632
1 56.447368
关于python - 遍历行和列,python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53539488/
我是一名优秀的程序员,十分优秀!