我有两个相关的变量(列):一个代表一个人的名字,另一个计算这个人一周锻炼的次数。问题在于可视化该数据。
当我想查看数据时,它看起来像这样:
x name wrk
0 0 E 1
1 1 A 2
2 2 B 5
3 3 A 3
4 4 C 6
现在,字母将重复该 pearson 在变量“wrk”中出现的次数。然后我只想看那封信,但不要重复。例如,当我想查看每个人的平均值时,我会看到一个字母及其在“wrk”上的平均值
wrk
name
A 4.625000
B 5.142857
C 5.400000
D 3.833333
E 4.785714
我只想查看 wrk 中的每个值,而名称中只有一个字母,所以我认为解决方案是将列表上的 wrk 转换为如下输出:
work
name
A 1:2:3:5:7:8:10
B 1:2:4:7:8
C 1:6:9
D 1:2:3:5:7:8:10
E 1:2:3:5:7:8:10
问题是我已经研究了如何做到这一点,但我还没有找到可以帮助我做到这一点的代码。有人可以帮助我吗?
(抱歉我的英语不好,我正在学习)
也许是这个?
df['wrk'] = df['wrk'].astype(str)
df = df.groupby('name')[['wrk']].agg(':'.join)
我是一名优秀的程序员,十分优秀!