作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有以下 pandas 数据框:
A B
0 16.3 1.10
1 23.2 1.33
2 10.7 -0.43
3 5.7 -2.01
4 5.4 -1.86
5 23.5 3.14
我想要完成的是通过比较 2 个相邻行中 A 列中的值来生成第三列,并对接下来的 2 行执行相同的操作,依此类推。
这可能有点令人困惑,所以我举一个例子:
16.3 - 23.2 < 5
那么新列第一行的值C
应该是Bad
,如果该差异是 ==5
那么新列应该是 Decent
和Good
如果差异是 >5
23.2 - 16.3
相反并生成 C
的值对于该差异的那一行因此生成的数据框应如下所示:
A B C
0 16.3 1.10 Bad
1 23.2 1.33 Good
2 10.7 -0.43 Decent
3 5.7 -2.01 Bad
4 5.4 -1.86 Bad
5 23.5 3.14 Good
我环顾了一下,发现你可以定义一个返回不同状态的函数,然后使用 df.apply。
所以我想也许可以创建 2 个函数:一个用于比较 A
的值的奇数行。到下一行,另一个用于与上一行进行比较的偶数行。
但是,我无法理解如何将这两个函数一起应用来生成列 C
.
我该如何实现这一点,或者如果有更简单的解决方案,该怎么做?
最佳答案
您可以使用numpy.select
与 numpy.isclose
用于比较 float 和精度,用于交换值创建辅助 DataFrame。
注意:
适用于行数对的解决方案。
print (df)
A B
0 16.3 1.10
1 23.2 1.33
2 10.7 -0.43
3 5.7 -2.01
4 5.4 -1.86
5 23.5 3.14
6 11.7 4.00
7 24.9 10.00
#create default Rangeindex
df = df.reset_index(drop=True)
#MultiIndex by integer and modulo division with reshape
df1 = df.set_index([df.index // 2, df.index % 2]).unstack()
#subtract first values with second in MultiIndex
df1 = df1.xs(0, axis=1, level=1) - df1.xs(1, axis=1, level=1)
#join together with multiplied df by -1
df1 = pd.concat([df1, df1 * -1]).sort_index().reset_index(drop=True)
print (df1)
A B
0 -6.9 -0.23
1 6.9 0.23
2 5.0 1.58
3 -5.0 -1.58
4 -18.1 -5.00
5 18.1 5.00
6 -13.2 -6.00
7 13.2 6.00
<小时/>
masks = [np.isclose(df1, 5), df1.values < 5]
vals = ['Decent','Bad']
#create new df and join to original
df = df.join(pd.DataFrame(np.select(masks, vals, 'Good'), columns=df.columns).add_suffix('_new'))
print (df)
A B A_new B_new
0 16.3 1.10 Bad Bad
1 23.2 1.33 Good Bad
2 10.7 -0.43 Decent Bad
3 5.7 -2.01 Bad Bad
4 5.4 -1.86 Bad Bad
5 23.5 3.14 Good Decent
6 11.7 4.00 Bad Bad
7 24.9 10.00 Good Good
关于python - 通过对 pandas 数据框中的奇数行和偶数行使用不同的条件来生成新列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53605830/
我是一名优秀的程序员,十分优秀!