gpt4 book ai didi

python - 将 pandas 数据框中的字符串转换为整数

转载 作者:太空宇宙 更新时间:2023-11-03 15:45:13 25 4
gpt4 key购买 nike

我有一个如下所示的数据集:

                Name       ARowss   TotalRowss        Percentage
motors 11 11 100
trck1 2 2 100
trck2 2 2 100
hydr1 4 4 100
gas1 2 2 100

我正在清理一些数据,我必须为“名称”中的每个值分配一个新数字。 “名称”列中的所有值都是唯一的。所以,从上面的数据集来看, “motors”应有 1,“trck1”应有 2,“trck2”应有 3,依此类推。

最佳答案

这是你想要的吗?

In [5]: df['id'] = pd.factorize(df.Name)[0]

In [6]: df
Out[6]:
Name ARowss TotalRowss Percentage id
0 motors 11 11 100 0
1 trck1 2 2 100 1
2 trck2 2 2 100 2
3 hydr1 4 4 100 3
4 gas1 2 2 100 4

或者这个,取决于你的目标:

In [10]: df.Name = pd.factorize(df.Name)[0] + 1

In [11]: df
Out[11]:
Name ARowss TotalRowss Percentage
0 1 11 11 100
1 2 2 2 100
2 3 2 2 100
3 4 4 4 100
4 5 2 2 100

它也适用于非唯一值:

In [15]: df
Out[15]:
Name ARowss TotalRowss Percentage
0 motors 11 11 100
1 trck1 2 2 100
2 trck2 2 2 100
3 hydr1 4 4 100
4 gas1 2 2 100 # duplicates in `Name`
5 gas1 2 3 111 #

In [16]: df.Name = pd.factorize(df.Name)[0] + 1

In [17]: df
Out[17]:
Name ARowss TotalRowss Percentage
0 1 11 11 100
1 2 2 2 100
2 3 2 2 100
3 4 4 4 100
4 5 2 2 100 #
5 5 2 3 111 #

关于python - 将 pandas 数据框中的字符串转换为整数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41813409/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com