我有以下列:
column
0 10
1 10
2 8
3 8
4 6
5 6
我的目标是找到今天的唯一值(在本例中为 3)并创建一个新列,该列将创建以下内容
new_column
0 3
1 3
2 2
3 2
4 1
5 1
编号从唯一值的长度 (3) 开始,如果当前行与基于原始列的上一行相同,则重复相同的编号。随着行值的变化,数字会减少。原始列中的所有唯一值都具有相同的行数(在这种情况下,每个唯一值有 2 行)。
我的解决方案是按原始列分组并创建一个如下所示的新列表:
i=1
new_time=[]
for j, v in df.groupby('column'):
new_time.append([i]*2)
i=i+1
然后我会按降序将列表排序展平。还有其他更简单的解决方案吗?
谢谢。
pd.factorize
i, u = pd.factorize(df.column)
df.assign(new=len(u) - i)
column new
0 10 3
1 10 3
2 8 2
3 8 2
4 6 1
5 6 1
字典.setdefault
d = {}
for k in df.column:
d.setdefault(k, len(d))
df.assign(new=len(d) - df.column.map(d))
我是一名优秀的程序员,十分优秀!